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本 书 将 严格 的 数学 定义 、 公 理化 和 演绎 方法 应 用 于 程序 设计 ， 讨 论 程序 与 保证 它们 能 正 
确 工作 的 灿 急 数学 理论 之 间 的 联系 。 书 中 把 理论 的 规程 、 基 于 这 些 写 出 的 算法 ， 以 及 描述 算 
法 性 质 的 引 理 和 定理 一 起 呈现 给 读者 ， 以 帮助 我 们 将 复杂 系统 分 解 为 一 些 具有 特定 行为 的 
组 件 。 

本 书 适合 软件 开发 人 员 和 需要 进行 程序 设计 的 科学 家 及 工程 师 阅 读 ， 也 可 供 高 等 院 校 计 
算 机 及 相关 专业 的 师 生 参 考 。 
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译 者 序 


在 Addison-Wesley 新 书 预 告 上 看 到 本 书 时 , 我 就 感觉 到 本 书 的 不 同 凡响 ， 
觉得 应 该 让 更 多 国内 同行 了 解 书 中 殖 涵 的 理念 . 我 立刻 把 信息 告诉 了 华章 的 
朋友 . 没 多 久 就 得 到 了 华章 引进 版 权 的 消息 . 

市 面 上 讨论 编程 的 书籍 浩如烟海 . 说 起 编程 , 人 们 头脑 中 浮现 的 多 半 是 
语言 、 代 码 、hacking、 测 试 、 排 除 程序 错误 , 以 及 与 之 相关 的 许多 琐碎 事务 . 
而 本 书 作者 看 到 的 重点 却 不 同 . 在 讨论 编程 时 , 他 们 关注 的 是 数学 、 结 构 、 规 
律 、 规 范 性 、 抽 象 、 推 导 、 前 后 条 件 、 验 证 等 等 . 本 书 作 者 的 技术 水 平和 成 
ЖИЕ БЕ, 但 为 什么 他 们 能 构造 出 像 STL 那样 的 疾 峰 之 作 , 这 件 事 却 值得 认 
真 思考 . 如 果 国 内 有 人 说 程序 的 基础 是 数学 , AH SAT AR > A SE 2 DL B: 
“你 懂得 什么 是 程序 ? 写 过 多 少 行 代码 ?” 但 是 , жй FEA 8 AS fE, 其 见 
解 和 论据 也 无 法 忽视 . 基于 上 述 基本 考虑 , 本 书 中 给 出 了 大 量 精妙 而 且 根基 坚 
实 的 程序 , 解决 了 一 个 个 具体 而 重要 的 问题 . 进一步 说 , 作者 还 揭示 了 这 些 程序 
的 理论 基础 , 并 从 多 个 角度 建立 起 它们 之 间 的 联系 , 使 之 可 能 成 为 无 数 实 际 程 
序 的 基础 构件 . 作者 的 根本 目标 , 或 许 就 是 希望 基于 这 种 思维 方法 和 开发 技术 ， 
为 范围 广泛 的 软件 系统 建立 起 坚实 基础 . 在 这 里 看 不 到 调 佩 和 讨好 读者 的 流 
行 俗语 或 插 科 打 放 ,只 有 严肃 的 叙述 、 分 析 和 讨论 . 阅读 本 书 的 过 程 绝 不 会 轻 
松 , 但 我 们 可 以 相信 , 在 这 里 的 付出 会 使 人 收获 厚 丰 . 

作者 取 “Elements” 作为 书 名 也 很 值得 玩味 . 我 们 都 知道 欧 几 里 得 的 名 
HLroixeta” (KF "Elements"), 中 文 译 为 《几何 原本 》 可 能 偏离 了 作者 的 本 
Ж. 欧 氏 应 该 是 想 为 一 种 世界 观 和 方法 论 提供 一 个 范本 , 其 内 涵 和 意义 绝 不 限 
于 今天 所 说 的 “几何 "领域 . 实际 上 , 《原本 》 希 望 展示 的 是 思维 和 研究 背后 的 
一 套 基础 概念 和 思想 . 现在 我 们 面 对 的 是 程序 , 这 是 一 个 完全 人 造 的 世界 , 这 里 
的 一 切 也 有 什么 “本 原 ” 吗 ? 本 书 作 者 基于 其 经 验 和 认识 也 想来 尝试 一 下 , 模 
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仿 欧 几 里 得 探究 一 下 位 于 所 有 编程 背后 的 最 根本 的 东西 . 作者 认为 , 程序 背后 
的 本 原 就 是 数学 的 各 种 概念 、 技 术 和 方法 , 需要 演绎 、 推 导 和 证 明 等 , 而 绝 不 
是 模糊 的 想法 和 草率 的 编码 和 蛮 力 调试 . 随 着 计算 机 被 更 广泛 地 应 用 于 各 种 
重要 领域 , 只 靠 朴素 认识 去 工作 将 越 来 越 显得 脆弱 和 不 可 信 . 从 这 个 角度 看 ， 
本 书 也 可 以 看 成 是 作者 的 规劝 和 忠告 . 

我 本 无 意 翻 译本 书 , 但 经 不 住 华章 的 朋友 一 再 相 邀 , 只 好 勉强 为 之 . 原 书 出 
自作 者 上 课 的 幻灯 片 , 8 0 # Ek, 涉及 面 广 , 找到 简洁 又 切中 原 义 的 译文 常常 很 
Ж, HELA EMMA, 每 一 遍 检查 都 会 发 现 许多 不 如 意 之 处 . 由 于 
没有 足够 的 时 间 , 经 常 有 其 他 事务 干扰 , 这 个 翻译 工作 一 拖 再 拖 . 但 无 论 如 何 ， 
一 件 事 总 要 有 个 结束 . 我 决定 现在 将 此 工作 告 一 段落 , 将 结果 交 给 出 版 社 和 读 
者 检验 . 我 希望 这 个 中 译本 能 对 读者 有 所 帮助 , 也 为 其 中 的 缺陷 和 不 足 负责 . 

为 尽 可 能 保持 原貌 , 我 基于 原 书 的 LaTeX 文件 编辑 译文 (感谢 作者 提供 的 
原文 件 ), 写 了 许多 LaTeX 宏 定 义 , 最 后 用 MIKTeX 生成 全 书 的 PDF 文件 交 给 
出 版 社 . 这 样 做 多 花 了 不 少时 间 , 但 有 利于 保持 全 书 (及 与 原 书 ) 的 统一 性 , 可 
以 减少 不 应 出 现 的 小 错误 . 当然 , 这 种 费时 费力 的 做 法 也 使 排版 错误 变 成 了 我 
的 个 人 责任 , 本 译本 已 收入 原作 者 迄今 的 所 有 勘误 , 翻译 中 发 现 的 原 书 错误 也 
都 得 到 了 作者 确认 . 为 方便 读者 阅读 , 本 书 实际 上 提供 了 两 套 索 引 ; 原 书 的 英 
文 索引 都 予以 保留 , 与 之 对 应 , 我 又 加 入 了 一 套 中 文 索引 (通过 LaTex ER), 供 
读者 交叉 参考 . 原作 者 自 创 了 不 少 术语 , 没有 习 见 译 法 , 我 只 能 设法 编造 出 相 
应 译文 , 其 合理 性 需要 时 间 检 验 . 此 外 , 正文 中 出 现 的 术语 都 给 出 了 英文 对 照 . 
有 关 本 书 的 工作 , 我 要 感谢 刘海 洋 在 使 用 LaTeX. 处 理 中 文 方面 的 若干 意见 , 感 
谢 编辑 发 现 了 译 稿 的 一 些 文字 错误 . 
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py ehn EENANER, 讨论 程序 与 保证 它们 能 正确 工作 的 抽 
象 数学 理论 之 间 的 联系 . 书 中 把 反映 这 些 理论 的 规程 (specification), 基于 这 些 
理论 写 出 的 算法 , 以 及 描述 算法 性 质 的 引 理 和 定理 一 起 呈现 给 读者 . 这 些 算法 
在 一 种 实际 程序 设计 语言 里 的 实现 是 本 书 的 中 心 . 虽然 规程 主要 是 供 人 阅读 ， 
但 它们 也 应 该 (或 者 说 必须 ) 严格 地 与 非 形式 化 的 、 供 机 器 使 用 的 代码 相 结合 ， 
必须 在 通用 的 同时 又 是 抽象 而 且 精 确 的 . 

与 在 其 他 科学 和 工程 领域 里 的 情况 一 样 , 适合 作为 程序 设计 的 基础 的 同样 
是 演绎 方法 . 演绎 方法 能 帮助 我 们 将 复杂 系统 分 解 为 一 些 具有 特定 数学 行为 
的 组 件 , 而 这 种 分 解 又 是 设计 高 效 、 可 靠 、 安 全 和 经 济 的 软件 的 前 提 . 

本 书 是 想 奉献 给 那些 希望 更 深入 地 理解 程序 设计 的 人 们 , 无 论 他 们 是 专职 
软件 开发 人 员 , 还 是 把 程序 设计 看 作 其 专业 活动 中 一 个 重要 组 成 部 分 的 科学 
家 或 工程 师 . 

本 书 编写 的 基本 想法 是 让 读者 从 头 到 尾 完 整 阅读 . 读者 只 有 通过 阅读 代 
码 、 证 明 引 理 、 完 成 练习 , 才能 真正 理解 书 中 的 各 方面 材料 . 此 外 我 们 还 建议 
了 一 些 项 目 , 其 中 有 些 是 完全 开放 的 . 本 书 的 内 容 很 紧凑 , 认真 的 读者 最 终 会 
看 到 书 中 各 部 分 之 间 的 联系 , 以 及 我 们 选择 这 些 材料 的 理由 . 发 现 本 书 在 体系 
结构 方面 的 原理 应 该 是 读者 的 一 个 目标 . 

我 们 假定 读者 已 经 具有 完成 各 种 基本 代数 操作 的 能 力 .: 还 假定 读者 熟悉 
逻辑 和 集合 论 的 基本 术语 , 如 普通 本 科 生 在 离散 数学 课程 中 学 习 的 内 容 . 附 
录 A 总 结 了 书 中 使 用 的 各 种 记 法 . 如 果 在 一 些 特定 的 算法 里 需要 某 些 抽象 代 
数 的 概念 , 书 中 会 给 出 相应 的 定义 . 我 们 还 假定 读者 熟悉 程序 设计 , 理解 计算 机 


1. 有 关 基 本 代数 知识 , 推荐 Chrystal [1904]. 
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体系 结构 ,2 理解 最 基本 的 算法 和 数据 结构 .3 

我 们 选用 C++, 是 因为 它 组 合 了 强 有 力 的 抽象 设施 和 基础 机 器 的 正确 表 
mA 这 里 只 用 了 该 语言 的 一 个 小 子 集 , 需求 被 写成 程序 里 的 结构 化 注释 . 我 们 
希望 不 熟悉 C++ 的 读者 也 能 阅读 本 书 . 附录 B 描述 了 书 中 使 用 的 C++ FR 
在 书 中 的 任何 地 方 , 在 需要 区 分 数学 记 法 和 C++ 的 地 方 , 根据 所 用 的 字体 、 
排版 和 上 下 文 就 能 确定 用 的 是 哪 种 意义 (是 数学 的 还 是 C++ 的 ). 虽然 书 中 的 
许多 概念 和 程序 与 STL (C++ 标准 模板 库 ) 里 的 东西 对 应 , 但 这 里 的 一 些 设计 
决策 是 与 STL RAK. 书 中 还 忽略 了 实际 程序 库 (如 STL) 必须 考虑 和 处 理 的 
许多 问题 , 如 名 字 空 间 、 可 见 性 、inline 指令 等 等 . 

第 1 章 描述 值 、 对 象 、 类 型 、 过 程 和 概念 . 第 2 — 5 章 描述 各 种 代数 结构 
(如 半 群 、 全 序 集 ) 上 的 算法 . 第 6 ~ 11 章 讨论 抽象 内 存 上 的 算法 . 第 12 章 讨 
论 包含 对 象 成 员 的 对 象 . 跋 给 出 了 我 们 对 本 书 中 六 释 的 工作 途径 的 反思 . 
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Dealing к e 值 、 对 象 、 类 型 、 
过 程 和 概念 , 它们 表示 了 与 计算 机 有 关 的 许多 不 同 的 理念 范 畸 . 这 里 还 要 详细 
讨论 本 书 的 中 心 观点 : 规范 性 . 对 一 个 过 程 , 规范 性 意味 着 它 对 相等 的 参数 总 
返回 相等 的 结果 . 对 一 个 类 型 , 规范 性 意味 着 它 应 该 有 相等 运算 符 , 以 及 保证 
相等 关系 的 拷贝 构造 函数 和 赋值 . 规范 性 使 我 们 能 应 用 等 值 推理 (使 用 等 值 替 
换 ) 去 变换 和 优化 程序 . 


11 4i": X4k, RH, KZ 


为 了 解释 什么 是 对 象 、 类 型 , 以 及 其 他 基本 的 计算 机 概念 , 概述 一 下 与 这 些 概 
念 对 应 的 理念 范畴 是 很 有 帮助 的 . 

抽象 实体 (abstract entity) 指 永 存 的 不 变 的 事物 , 而 具体 实体 (concrete 
entity) 指 具体 的 个 别 的 事物 , 其 出 现 和 存在 与 时 间 和 空间 有 关 . 一 个 属性 
(attribute) 是 具体 实体 与 抽象 实体 之 间 的 一 种 对 应 关系 , 它 描述 了 该 具体 实体 
的 某 种 性 质 、 度 量 或 者 品质 . 标识 (identity) 是 我 们 感知 实在 世界 的 一 种 基本 
概念 , 它 确定 一 个 事物 在 随 着 时 间 变 化 中 的 不 变性 . 一 个 具体 实体 的 属性 可 以 
改变 , 但 这 种 改变 不 会 影响 其 标识 . 一 个 具体 实体 的 一 个 快照 (snapshot) RE 
在 某 个 特定 时 间 点 上 这 一 事物 的 所 有 属性 的 完整 集合 . 具体 实体 不 仅 包括 所 
有 物理 上 存在 的 实体 , 还 包括 法 律 的 、 经 济 的 或 者 政治 的 实体 . 蓝 色 和 13 是 抽 
象 实体 的 例子 . 苏 格 拉 底 和 美利坚 合众国 是 具体 实体 的 例子 . 苏 格 拉 底 的 眼睛 
的 颜色 和 美国 的 州 的 个 数 是 属性 的 例子 . 

一 个 抽象 类 别 (abstract species) 描述 一 批 本 质 上 等 价 的 抽象 实体 的 共性 . 
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抽象 类 别 的 例子 如 自然 数 和 颜色 . 一 个 具体 类 别 (concrete species) 描述 一 集 本 
质 上 等 价 的 具体 实体 的 共性 . 具体 类 别 的 例子 如 男人 和 美国 的 州 . 

一 个 函数 (function) 是 一 套 规则 , 它 将 一 个 或 几 个 取 自 某 个 或 某 些 相应 类 
别 的 抽象 实体 ( 称 为 其 参量 , argument), 关联 到 来 自 某 个 抽象 类 别 的 一 个 抽象 
实体 ( 称 为 其 结果 , result). 函数 的 例子 如 后 继 函数 , 它 将 每 个 自然 数 关联 于 紧 
随 其 后 的 那个 自然 数 ; 再 如 将 两 种 颜色 关联 于 它们 的 混合 色 的 函数 . 

一 个 抽象 类 属 (abstract genus) 描述 在 某 些 方面 类 似 的 一 些 不 同 的 抽象 类 
别 . 抽象 类 属 的 例子 如 数 和 二 元 运算 符 . 一 个 具体 类 属 (concrete genus) 描述 在 
某 些 方面 类 似 的 一 些 不 同 的 具体 实体 . 具体 类 属 的 例子 如 哺乳 动物 和 鸟 . 

一 个 实体 属于 某 个 特定 的 类 别 , 这 个 类 别 确定 了 该 实体 的 构造 和 存在 的 规 
则 . 一 个 实体 可 以 属于 多 个 类 属 , 每 个 类 属 描述 该 实体 的 一 些 特定 性 质 . 

在 本 章 的 下 面部 分 , 我 们 将 论证 对 象 和 值 都 是 实体 , 类 型 是 类 别 , 而 概念 是 
类 属 . 


1.2 值 


如 果 不 知 道 如 何 解释 , 在 计算 机 里 能 看 到 的 也 就 是 一 些 0 和 1. 一 项 数据 
(datum) 就 是 一 个 0 和 1 的 有 穷 序 列 . 

一 个 值 类 型 (value type) 是 一 个 (抽象 或 具体 ) 类 别 和 一 集 数据 之 间 的 一 
个 对 应 关系 . 对 应 于 某 特 定 实体 的 数据 称 为 该 实体 的 一 个 表示 (representation); 
而 这 一 实体 称 为 相应 数据 的 解释 (interpretation). 我 们 把 一 项 数据 和 它 的 解释 
称 为 一 个 值 (value). 值 的 例子 如 采用 大 尾 格式 的 32 位 二 进 制 补 码 表 示 的 整数 ; 
或 者 用 连续 的 两 个 32 位 二 进 制 序列 表示 的 有 理 数 , 这 两 个 二 进 制 序列 分 别 被 
解释 为 用 整数 表示 的 分 子 和 分 母 , 而 这 两 个 整数 又 用 大 尾 格式 的 32 位 二 进 制 
补 码 表示 . 

一 项 数据 相对 于 一 个 值 类 型 是 良 形式 的 (well-formed), 当 且 仅 当 这 一 数据 
表示 了 该 类 型 里 的 一 个 抽象 实体 . 例如 , 每 个 32 位 的 二 进 制 序列 解释 为 模 二 补 
码 的 整数 时 都 是 良 形 式 的 ; 而 IEEE 754 浮 点 的 一 个 NaN (Not a Number, 不 是 
数 ) 解释 为 实数 就 不 是 良 形式 的 . 

一 个 值 类 型 是 真 部 分 的 (properly partial), 如 果 它 的 值 只 能 表示 对 应 抽象 类 
别 里 的 所 有 抽象 实体 的 一 个 真子 集 ; 否则 它 就 是 全 的 (total). 举例 说 , 类 型 int 
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是 真 部 分 的 , 而 类 型 bool 是 全 的 . 

一 个 值 类 型 是 唯一 表示 的 (uniquely represented), 当 且 仅 当 每 个 抽象 实体 
至 多 有 一 个 对 应 的 值 . 例如 , 如 果 表 示 真 值 的 类 型 使 用 了 一 个 字 节 , 其 中 的 0 解 
RAB 而 其 他 情况 都 解释 为 真 , 那么 这 个 类 型 就 不 是 唯一 表示 的 . 如 果 一 个 
类 型 把 整数 表示 为 一 个 符号 仁和 一 个 无 符号 量 , 它 就 不 能 为 0 提供 唯一 表示 . 
用 模 二 补 码 表示 整数 的 类 型 是 唯一 表示 的 . 

一 个 值 类 型 是 有 歧义 的 (ambiguous), 当 且 仅 在 当 该 类 型 里 存在 具有 多 种 
解释 的 值 . 有 歧义 的 否定 是 无 歧义 (unambiguous). 例如 , 将 长 于 一 个 世纪 的 纪 
年 表示 为 两 个 十 进 制 数 的 类 型 就 是 有 歧义 的 . 

一 个 值 类 型 里 的 两 个 值 相 等 (equality), 当 且 仅 当 它们 表示 的 是 同一 个 抽 
象 实体 . 说 两 个 值 是 表示 相等 的 (representational equality), 当 且 仅 当 它们 的 数 
据 是 两 个 相同 的 0/1 序列 . 


3188 1.1 如 果 一 个 值 类 型 具有 唯一 表示 , 相等 就 蕴涵 着 表示 相等 . 
引 理 1. 2 如 果 一 个 值 类 型 无 歧义 , 表示 相等 就 蕴涵 着 相等 . 


如 果 一 个 值 类 型 是 唯一 表示 的 , 通过 检查 其 0/1 序列 是 否 相同 的 方式 就 可 
以 实现 相等 判断 . 否则 就 必须 以 一 种 与 该 类 型 的 解释 协调 的 方式 来 实现 相等 
判断 . 如 果 对 于 一 个 值 类 型 经 常 需 要 生成 新 值 而 较 少 检查 相等 , 那 就 可 以 考虑 
选用 非 唯一 性 的 表示 , 因为 这 样 做 有 可 能 使 新 值 的 生成 更 快 , 而 使 相等 判断 较 
18. 这 类 的 例子 如 , 用 一 对 整数 表示 的 两 个 有 理 数 相等 , 条 件 是 它们 可 以 约 简 
到 同一 个 最 简 分 数 . 再 如 用 非 排序 序列 表示 的 两 个 集合 相等 , 条 件 是 经 过 排序 
并 消除 重复 元 素 后 , 它们 的 对 应 元 素 相等 . 

有 些 时 候 , 实现 真正 的 行为 上 的 (behavioral) 相等 判断 的 代价 过 大 甚至 根 
本 就 不 可 能 . 例如 , 将 可 计算 函数 编码 为 一 个 类 型 时 的 情况 就 是 这 样 . 在 这 种 
情况 下 , 我 们 只 能 接受 弱 得 多 的 表示 相等 的 概念 , 简单 判断 两 个 值 的 0/1 序列 
是 否 相等 . 

计算 机 把 抽象 实体 上 的 函数 实现 (implement) 为 值 上 的 函数 (function). B 
然 这 些 值 驻 留 在 内 存 , 但 一 个 完好 实现 的 值 上 的 函数 并 不 依赖 于 特定 的 内 存 
地 址 , 它 实现 的 是 一 个 从 值 到 值 的 映射 (mapping). 

在 一 个 值 类 型 上 定义 的 一 个 函数 是 规范 的 (regular), 当 且 仅 当 它 遵从 相等 
fk: 给 它 的 某 个 参数 换 一 个 相等 的 值 , 它 一 定 还 得 出 相等 的 结果 . 大 多 数 的 数 
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值 函 数 都 是 规范 的 , 非 规范 的 数值 函数 的 一 个 例子 是 取 分 母 函数 : 假设 有 理 数 
简单 地 表示 为 一 对 整数 , 而 该 函数 简单 返回 表示 分 子 的 那个 整数 . 例如 1 = 2, 
但 numerator(4) x numerator(2). 规范 函数 使 我 们 可 以 做 等 式 推理 (equational 
reasoning), 允许 我 们 做 等 值 赫 换 . 

非 规范 的 函数 依赖 于 其 参数 的 具体 表示 , 而 不 仅仅 是 参数 的 解释 . 在 设计 
一 个 值 类 型 的 表示 时 , 有 两 项 相关 的 工作 必须 处 理 : 实现 相等 判断 , 确定 哪些 
函数 应 该 是 规范 的 . 


1.3 对 象 


一 个 存储 (memory) 就 是 一 集 存储 字 (word), 其 中 每 个 字 有 一 个 地 址 (address) 
和 一 项 内 容 (content). 地 址 是 一 种 固定 大 小 的 值 , 这 个 大 小 称 为 地 址 长 度 . 而 内 
容 是 另 一 固定 大 小 的 值 , 其 长 度 称 为 字 长 . 通过 装载 (load) 操作 可 以 取得 一 个 
地 址 的 内 容 . 通过 保存 (store) 操作 改变 一 个 地 址 所 关联 的 内 容 . 存储 的 实例 如 
计算 机 主 存 里 的 一 组 字 节 , 或 磁盘 驱动 器 里 的 一 组 区 块 . 

一 个 对 象 (object) 就 是 一 个 具体 实体 的 表示 , 并 且 是 作为 某 个 存储 里 一 个 
值 . 对 象 有 状态 (state), 其 状态 就 是 某 个 值 类 型 的 一 个 值 . 对 象 的 状态 可 以 改 
变 . 对 于 给 定 的 与 某 个 具体 实体 对 应 的 一 个 对 象 , 其 状态 对 应 于 该 实体 的 一 个 
快照 . 一 个 对 象 拥有 一 集资 源 (resource), 用 于 保存 其 状态 , 如 一 些 存储 字 或 者 
文件 里 的 一 些 记录 . 

即使 某 对 象 的 值 是 一 个 连续 的 0/1 序列 , 保存 这 些 0/1 的 资源 也 可 以 不 是 
连续 的 . 相应 的 解释 能 给 出 这 个 对 象 的 整体 . 看 一 个 例子 : 两 个 double 可 以 解 
释 为 一 个 复数 , 为 此 并 不 要 求 它们 紧邻 存放 . 一 个 对 象 的 资源 也 完全 可 以 位 于 
不 同 的 存储 里 . 但 是 本 书 只 处 理 位 于 一 个 具有 统一 地 址 空间 的 存储 里 的 对 象 ， 
这 里 的 每 个 对 象 有 一 个 唯一 的 起 始 地 址 (starting address), 从 它 出 发 可 以 找到 
该 对 象 的 所 有 资源 . 

一 个 对 象 类 型 (object type) 是 一 种 在 存储 中 保存 和 修改 值 的 模式 . 与 每 个 
对 象 类 型 相对 应 的 有 一 个 描述 该 类 型 对 象 的 状态 的 值 类 型 . 每 个 对 象 属于 某 
一 个 对 象 类 型 . 作为 对 象 类 型 的 例子 , 请 考虑 技 32 位 模 二 补 码 方式 , 采用 小 尾 
格式 和 4 字 节 边 界 对 齐 表示 的 整数 . 

值 和 对 象 扮 演 着 互补 的 角色 . 值 不 会 改变 , 与 在 计算 机 里 的 特定 实现 方式 
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无 关 . 对 象 可 以 改变 , 具有 与 具体 计算 相关 的 实现 方式 . 在 任何 一 个 时 间 点 , 一 
个 对 象 的 状态 都 可 以 描述 为 一 个 值 . 原则 上 说 , 这 个 值 可 以 写 在 纸 上 (做 出 一 
个 快照) 或 者 序列 化 (serialize) 后 通过 通信 链 路 传输 . 用 值 的 方式 描述 对 象 的 状 
Ж, 在 讨论 相等 性 时 就 可 以 抽象 掉 对 象 的 具体 实现 方式 . 函数 式 程序 设计 处 理 
的 是 值 ; 而 命令 式 程序 设计 处 理 的 是 对 象 . 

我 们 用 值 来 表示 实体 . 因为 值 是 不 变 的 , 它们 可 以 表示 抽象 实体 . 也 可 以 用 
值 的 序列 来 表示 某 具 体 实 体 的 一 些 快照 的 序列 . 对 象 保存 着 代表 实体 的 值 . 由 
于 对 象 可 以 变化 , 因此 可 以 用 于 表示 具体 实体 , 并 通过 令 其 不 断 取 得 新 值 的 方 
式 表示 该 实体 的 变化 . 也 可 用 对 象 表示 抽象 实体 , 这 时 它们 将 保持 不 变 , 或 者 
取 相 应 抽象 实体 的 一 些 不 同 近似 值 . 

在 计算 机 里 使 用 对 象 , 有 如 下 三 个 原因 . 


1. 对 象 能 模拟 可 以 改变 的 具体 实体 , 例如 工资 系统 里 的 雇员 记录 . 


2. 对 象 为 实现 值 上 的 函数 提供 了 强 有 力 的 支持 , 例如 写 一 个 用 迭代 算法 实 
现 浮 点 数 平方 根 的 过 程 . 


3. 带 存储 的 计算 机 是 目前 唯一 可 用 的 通用 计算 设备 . 


值 类 型 的 某 些 性 质 也 可 用 于 对 象 类 型 . 一 个 对 象 是 良 形式 的 (well-formed), 
当 且 仅 当 其 状态 是 良 形式 的 . 一 个 对 象 类 型 是 真 部 分 的 (properly partial), 当 且 
仅 当 其 值 类 型 是 真 部 分 的 ; 否则 它 就 是 全 的 (total). 一 个 对 象 类 型 是 唯一 表示 
的 (uniquely represented), 当 且 仅 当 其 值 类 型 是 唯一 表示 的 . 

由 于 具体 实体 有 标识 , 表示 它们 的 对 象 也 要 有 与 之 对 应 的 概念 . 一 个 标识 
符号 (identity token) 是 一 个 唯一 值 , 它 表 示 相 应 对 象 的 标识 , 可 以 从 相应 对 象 
的 值 及 其 资源 的 地 址 计算 出 来 . 标识 符号 的 例子 如 对 象 的 地 址 , 或 者 到 保存 着 
该 对 象 的 数组 里 的 下 标 , 或 者 人 事 记 录 里 的 雇员 编号 . 对 标识 符号 的 相等 检查 
对 应 于 实体 标识 的 相等 检查 . 在 应 用 系统 运行 期 间 , 一 个 特定 对 象 有 可 能 在 一 
个 数据 结构 里 移动 , 也 可 能 从 一 个 数据 结构 移动 到 另 一 个 , 这 种 移动 有 可 能 改 
变 对 象 的 标识 符号 . 

同样 类 型 的 两 个 对 象 相 等 (equality), 当 且 仅 当 它们 的 状态 相等 . 如 果 两 个 
对 象 相等 , 我 们 就 说 其 中 的 一 个 是 另 一 个 的 拷贝 (copy). 修改 一 个 对 象 并 不 会 
对 它 的 任何 拷贝 产生 影响 . 
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本 书 将 使 用 一 种 编程 语言 , 在 该 语言 里 不 能 脱离 对 象 和 对 象 类 型 去 描述 值 
和 值 类 型 . 由 于 这 种 情况 , 从 现在 开始 , 只 要 提 到 类 型 时 没 加 修饰 词 , 那么 就 是 
指 对 象 类 型 . 


1.4 过 程 


一 个 过 程 (procedure) 是 一 个 指令 序列 , 它 修改 某 些 对 和 象 的 状态 , 也 可 能 构造 或 
者 销毁 一 些 对 象 . 
根据 程序 员 的 意图 , 与 一 个 过 程 交互 的 对 象 分 为 四 类 . 


1. 输入 输出 (input/output), 指 该 过 程 通过 其 参数 或 返回 值 直接 或 间接 传递 
的 那些 对 象 . 


2. 局 部 状态 (local state), 该 过 程 在 其 一 次 调用 期 间 创 建 、 销 毁 或 修改 的 那 
些 对 象 . 


3. 全 局 状态 (global state), 该 过 程 和 其 他 过 程 在 多 次 调用 中 访问 的 对 象 . 


4. 拥有 的 状态 (own state), 仅 供 该 过 程 (及 其 隶属 过 程 ) 访问 但 又 能 被 该 过 
程 的 多 次 调用 共享 的 对 象 . 


如 果 一 个 对 象 作 为 参数 或 结果 传递 , 称 它 是 直接 传递 的 ; 如 果 是 通过 指针 
或 类 似 指针 的 机 制 传递 , 则 称 它 是 间接 传递 的 . 如 果 一 个 对 象 被 某 个 过 程 读 但 
是 并 不 修改 , 称 它 是 该 过 程 的 输入 . 如 果 一 个 对 象 被 某 过 程 写 入 、 创 建 或 销毁 ， 
但 该 过 程 并 不 访问 其 初始 状态 , 则 称 它 是 该 过 程 的 输出 . 如 果 一 个 对 象 被 某 过 
程 既 读 又 修改 , 称 它 是 该 过 程 的 输入 /输出 . 

一 个 类 型 的 计算 基 (computational basis) 是 有 穷 的 一 集 过 程 , 基于 它们 可 
以 构造 出 该 类 型 上 的 其 他 过 程 . 一 组 基 是 高 效 的 (efficient), 当 且 仅 当 基于 它 实 
现 的 任何 过 程 的 效率 不 比 基 于 任何 其 他 基 写 出 的 过 程 低 效 . 例如 , 对 k- 位 无 符 
号 整数 的 一 组 只 提供 0, 相等 判断 和 后 继 操 作 的 基 就 不 是 高 效 的 , 因为 基于 后 
继 函数 实现 加 法 的 复杂 性 是 k 的 指数 函数 . 

一 组 基 是 有 表达 力 的 (expressive), 当 且 仅 当 基于 它 可 以 紧凑 而 方便 地 定义 
相关 类 型 上 的 其 他 过 程 . 特别 是 , 如 果 合 适 的 话 , 一 个 基 应 该 提供 所 有 常用 的 
数学 运算 . 举例 说 , 虽然 减法 运算 可 以 通过 求 负 和 加 法 实现 , 但 在 一 个 有 表达 力 
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的 基 中 应 该 直接 提供 它 . 与 此 类 似 , 求 负 也 可 以 通过 减法 和 0 实现 , 但 在 有 表达 
力 的 基 中 也 应 直接 提供 . 


1.5 规范 类 型 


存在 这 样 一 组 过 程 , 如 果 把 它们 包含 到 一 个 类 型 的 计算 基 中 , 就 能 方便 地 把 对 
象 放 入 各 种 数据 结构 , 或 者 通过 算法 把 对 象 从 一 个 数据 结构 复制 到 另 一 数据 
结构 . 我 们 称 具有 这 样 的 基 的 类 型 为 规范 的 (regular), 因为 使 用 这 样 的 类 型 可 
以 保证 程序 行为 的 规范 性 , 进而 获得 类 型 之 间 的 互 操作 性 .! 可 以 从 内 部 类 型 ， 
如 bool、int, 以 及 限制 到 良 形式 值 的 double, 看 到 规范 类 型 的 语义 . 一 个 类 型 
是 规范 的 , 当 且 仅 当 它 的 基 包 含 了 相等 检查 、 赋 值 、 析 构 操 作 、 默 认 构 造 操 
作 、 拷 贝 构造 操作 、 一 个 全 序 判断 ? 和 一 个 基础 类 型 .3 

相等 判断 是 一 个 过 程 , 它 以 同类 型 的 两 个 对 象 为 参数 , 当 且 仅 当 两 个 对 象 
的 状态 相等 时 返回 真 . 同样 应 该 定义 不 等 判断 , 它 应 返回 相等 判断 的 否定 . 我 
们 使 用 下 面 记 法 : 





赋值 (assignment) 是 一 个 过 程 , 它 以 同类 型 的 两 个 对 象 为 参数 , 使 得 第 一 
个 对 象 等 于 第 二 个 , 但 并 不 修改 第 二 个 对 象 . 赋值 的 意义 不 依赖 于 第 一 个 对 象 
的 初 值 . 我 们 使 用 下 面 记 法 : 


规程 | C++ 
WH [аъ а= ъ 


析 构 操作 (destructor) 是 一 个 过 程 , 它 结 束 一 个 对 象 的 存在 . 对 一 个 对 象 调 
用 析 构 操作 之 后 , 就 不 能 再 将 任何 过 程 作 用 于 它 , 而 且 它 以 前 的 存储 位 置 和 资 
源 都 可 以 用 于 其 他 用 途 了 . 析 构 操作 经 常 被 隐 式 地 调用 . 全 局 对 象 在 应 用 程序 
1. 虽 然 规范 性 是 STL 的 设计 基础 , 其 正式 定义 最 早出 现在 文献 Dehnert and Stepanov [2000] Ф. 


2. 严 格 的 说 法 要 到 第 4 章 才能 说 清楚 , 它 可 以 是 一 个 全 序 , 或 者 一 个 默认 的 全 序 . 
3. 基 础 类 型 在 第 12 章 定义 . 
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终止 时 销毁 ( 析 构 ), 局 部 对 象 在 它们 声明 所 在 的 块 退出 时 销毁 , 数据 结构 的 元 
素 在 数据 结构 销毁 时 也 被 销毁 . 

构造 操作 (constructor) 是 一 个 过 程 ， 它 把 一 些 存 储 位 置 变换 到 一 个 对 象 . 
其 可 能 行为 可 以 是 什么 也 不 做 , 也 可 以 是 创建 极其 复杂 的 对 象 . 

一 个 对 象 处 于 部 分 成 形 (partially formed) 状态 , 如 果 它 已 经 可 以 赋值 或 销 
QR 对 于 部 分 成 形 但 尚未 完全 成 形 的 对 象 , 除了 赋值 ( 放 在 左边 ) 和 析 构 , 做 其 
他 任何 过 程 的 效果 都 无 定义 . 


引 理 1.3 良 形式 的 对 象 也 是 部 分 成 形 的 . 


默认 构造 操作 (default constructor) 没有 参数 , 且 能 使 对 象 达到 部 分 成 形 的 
状态 . 我 们 将 采用 下 面 记 法 : 


C++ 
类 型 T 的 局 部 对 象 T a; 
类 型 T 的 匿名 对 象 | TO 
拷贝 构造 操作 (copy constructor) 有 一 个 同类 型 的 参数 , 它 构造 出 一 个 等 于 
该 参数 的 新 对 象 . 我 们 将 采用 下 面 记 法 : 
| c++ 
X b 的 局 部 拷贝 |T a = b; 





1.6 规范 过 程 


一 个 过 程 是 规范 的 , 当 且 仅 当 将 其 输入 替换 为 任何 相等 的 对 象 , 它 给 出 的 结果 
与 以 前 相等 . 就 像 值 类 型 一 样 , 在 定义 一 个 对 象 类 型 时 , 必须 在 如 何 实现 类 型 
里 的 相等 , 以 及 哪些 过 程 应 该 具有 规范 性 方面 有 一 种 统一 的 考虑 . 


练习 1.1 请 将 规范 的 概念 扩展 到 过 程 的 输入 输出 对 象 ( 即 那些 既 读 又 修改 的 
对 象 ). 


虽然 规范 性 应 该 是 最 基本 的 选择 , 也 有 些 因素 要 求 有 非 规范 过 程 . 
1. 返回 一 个 对 象 的 地 址 的 过 程 ; 例如 , 内 部 函数 addressof. 
2. 返回 由 真实 世界 的 状态 确定 值 的 过 程 , 如 返回 时 钟 或 其 他 设备 的 值 . 
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3. 返回 依赖 于 自己 拥有 的 状态 的 值 的 过 程 ; 例如 伪 随 机 数 生成 器 . 


4. 返回 与 一 个 对 象 的 表示 相关 的 某 些 属性 的 值 的 过 程 , 例如 为 数据 结构 保 
留 的 存储 量 . 


函数 式 过 程 (functional procedure) 是 在 规范 类 型 上 定义 的 一 类 规范 过 程 ， 
它们 有 一 个 或 几 个 直接 输入 和 一 个 作为 过 程 结果 的 返回 值 . 函数 式 过 程 的 规 
范 性 使 我 们 可 以 采用 两 种 技术 为 其 传递 输入 . 如 果 参 数 的 规模 较 小 , 或 者 过 程 
里 需要 参数 的 可 修改 拷贝 , 那么 可 以 用 值 的 方式 传递 它 , 做 出 参数 的 一 个 局 部 
T6 UL. 否则 可 以 用 常量 引用 的 方式 传递 它 . 函数 式 过 程 可 以 实现 为 C++ 的 函 
数 、 函 数 指针 或 者 函数 对 象 .4 

下 面 是 一 个 函数 式 过 程 : 
int plus.O(int a, int b) 
t 














return a + b; 


下 面 是 一 个 语义 等 价 的 函数 式 过 程 : 


int plus i(const int& a, const int& b) 
1 


return a * b; 


下 面 过程 的 语义 也 与 上 面 两 个 等 价 , 但 它 不 是 函数 式 的 , 其 输入 和 输出 参 
数 都 是 间接 传递 的 : 
void plus.2(int* a, int* b, int* c) 
1 


жс = жа + *b; 


在 plus-2 HB, a Mlb 是 输入 对 象 , c 是 输出 对 象 . 函数 式 过 程 的 概念 是 语法 
性 质 而 不 是 语义 性 质 : 按 我 们 的 术语 , plus-2 是 规范 的 但 不 是 函数 式 的 . 


4.C++ 的 函数 不 是 对 象 , 不 能 作为 参数 传递 ; C++ 函数 指针 和 函数 对 象 是 对 象 , 可 以 作为 参 
数 传递 . 
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一 个 函数 式 过 程 的 定义 空间 (definition space) 是 其 预 设 的 可 能 输入 值 集合 
的 一 个 子 集 . 函数 式 过 程 对 于 其 定义 空间 里 的 输入 总 终止 ; 而 对 超出 其 定义 空 
间 的 输入 , 它 可 能 不 终止 , 也 或 许 不 能 返回 有 意义 的 值 . 

同 源 的 (homogeneous) 函数 式 过 程 的 输入 对 象 都 属于 同一 个 类 型 . AMR 
数 式 过 程 的 定义 域 (domain) 是 其 输入 的 类 型 . 我 们 并 不 把 非 同 源 的 函数 式 过 
程 的 定义 域 说 成 是 其 输入 类 型 的 直 积 , 而 是 个 别 地 讨论 过 程 的 各 个 输入 类 型 . 

一 个 函数 式 过 程 的 值 域 (codomain) 是 其 输出 的 类 型 . 函数 式 过 程 的 结果 
空间 (result space) 是 其 值 域 的 一 个 子 集 , 是 该 过 程 从 其 定义 空间 取得 输入 后 返 
回 的 所 有 可 能 值 的 集合 . 

考虑 函数 式 过 程 


int square(int n) { return n * n; } 


其 定义 域 和 值 域 都 是 inv, 其 定义 空间 是 平方 值 在 此 类 型 里 可 以 表示 的 所 有 整 
数 的 集合 , 而 其 结果 空间 是 这 个 类 型 里 可 以 表示 的 平方 整数 的 集合 . 


练习 1.2 假设 int 是 32- 位 的 模 二 补 码 类 型 , 请 精确 给 出 上 面 函 数 式 过 程 的 定 
义 空 间 和 结果 空间 . 


1.7 概念 


如 果 一 个 过 程 使 用 了 一 个 类 型 , 它 就 会 依赖 于 该 类 型 的 语法 、 语 义 , 还 有 其 计 
算 基 的 复杂 性 . 在 语法 上 , 它 依赖 于 一 些 确定 的 文字 量 和 一 些 具有 特定 名 字 和 
Ж £ (signature) 的 过 程 的 存在 ; 其 语义 依赖 于 基 过 程 的 语义 ; 其 复杂 性 依赖 于 
基 过 程 的 时 间 和 空间 复杂 性 . 如 果 用 另 一 个 具有 同样 性 质 的 类 型 取代 这 个 类 
型 , 程序 将 仍然 是 正确 的 . 如 果 不 是 基于 具体 的 类 型 , 而 是 基于 对 类 型 的 一 些 
EX (通过 语法 和 语义 性 质 描述 ) 来 设计 软件 部 件 , 例如 设计 库 过程 或 数据 结 
构 , 一 定 能 提高 它们 的 可 用 性 . 我 们 将 这 样 的 一 组 要 求 称 为 一 个 概念 (concept). 
类 型 表示 类 别 ; 而 概念 表示 类 属 . 

要 描述 概念 , 就 需要 有 一 些 处 理 类 型 的 机 制 , 包括 类 型 属性 、 类 型 函数 
和 类 型 构造 符 . 类 型 属性 (type attribute) 是 从 一 个 类 型 到 一 个 值 的 映射 , 它 
描述 有 关 类 型 的 某 种 特征 . 类 型 属性 的 例子 如 C++ 里 提供 的 内 部 类 型 属性 
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sizeof (т), 一 个 类 型 的 对 象 的 对 齐 方式 , 以 及 一 个 struct 的 成 员 个 数 等 . WR 
F 是 一 个 函数 式 过程 类 型 , Arity(F) 返回 其 输入 的 个 数 . 

类 型 函数 (type function) 是 从 一 个 类 型 到 一 个 从 属 类 型 的 映射 . 类 型 函数 
的 一 个 例子 是 : 从 给 定 的 “到 芽 的 指针 ”得 到 类 型 T. 在 某 些 情况 下 , 定义 一 个 
带 有 一 个 附加 的 整数 参数 的 带 索引 (indexed) 类 型 函数 可 能 很 有 用 . 例如 定义 
一 个 类 型 函数 , 它 返 回 一 个 结构 类 型 的 第 i 个 成 员 的 类 型 (从 0 开始 计 ). 如 果 
F 是 一 个 函数 式 过 程 类 型 , 类 型 函数 Codomain(F) 返回 其 结果 的 类 型 . ШЖ Р 是 
一 个 函数 式 过 程 且 i< Arity(F), 索引 类 型 函数 InputType(F, i) 返回 其 第 i 个 参数 
的 类 型 (从 0 开始 计 ).5 

类 型 构造 符 (type constructor) 是 从 一 些 已 有 类 型 出 发 构造 新 类 型 的 机 制 . 
举例 说 , pointer(T) 是 一 个 内 部 提供 的 类 型 构造 符 , 它 从 一 个 类 型 T 出 发 返回 
“指向 T 的 指针 ” 类型; struct 是 一 种 内 部 提供 的 n 元 类 型 构造 符 ; 一 个 结构 模 
板 是 一 个 用 户 定义 的 n 元 类 型 构造 符 . 

如 果 了 是 一 个 mn 元 类 型 构造 符 , 下 面 用 Tuus, 表示 将 它 应 用 于 类 型 
To, Toi 一 个 重要 例子 是 pair (二 元 组 ), 将 其 应 用 于 规范 类 型 TA T, 就 得 
到 了 一 个 struct 类 型 pair n 它 有 一 个 类 型 为 T 的 成 员 m0 和 一 个 类 型 为 Ti 
的 成 员 ml. 要 保证 类 型 pair n 本 身 也 是 规范 的 , 就 要 求 它 的 相等 、 赋 值 、 析 
构 和 构造 操作 都 是 基于 类 型 TA Ty, 通过 按 两 个 成 员 分 别 做 的 方式 定义 . 同样 
的 技术 可 以 用 于 任何 其 他 元 组 类 型 , 例如 triple (三 元 组 ). 第 12 章 将 说 明 如 何 
实现 .pair nm, 并 说 明 更 复杂 的 类 型 构造 符 如 何 维持 规范 性 . 

采用 更 形式 化 一 点 的 说 法 , 一 个 概念 (concept) 是 对 一 个 或 多 个 类 型 的 需 
求 的 一 个 描述 , 这 一 描述 以 对 类 型 上 的 过 程 、 类 型 属性 和 类 型 函数 的 存在 
及 其 相关 性 质 的 方式 给 出 . 如 果 某 个 ( 某 些 ) 特定 类 型 满足 这 些 需 求 , 就 说 这 
一 概念 被 这 个 (或 这 些 ) 类 型 建 模 (modeled), 或 者 说 它们 是 这 一 概念 的 模型 
(model). 要 断言 概念 e 被 类 型 To... Tn- MB, 我 们 写 C(To,.….,T。-1). HARE 
意 的 满足 概念 e' 的 类 型 也 必定 满足 概念 e, MUMS e^ 精 化 (refine) 概念 e. 
WR e' 精 化 ©, 也 说 e HF C". 

类 型 概念 (type concept) 指定 义 在 一 个 类 型 上 的 一 个 概念 . 举例 说 , C++ 
定义 了 类 型 概念 整数 类 型 , 它 被 无 符号 整数 类 型 和 有 符号 整数 类 型 精 化 . 而 
STL 定义 了 类 型 概念 序列 (sequence). 前 面 一 直 用 基本 类 型 概念 Regular 和 


5. 附 录 B 说 明了 怎样 在 C++ 里 定义 类 型 属性 和 类 型 函数 . 
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FunctionalProcedure, 它们 对 应 于 前 面 给 出 的 非 形式 化 定义 . 
我 们 可 以 用 标准 的 数学 记 法 来 形式 化 地 定义 各 种 概念 . 要 定义 概念 e, 采 
用 的 写法 是 


€(To,...,Tn_1) Š 
£o 
Л ё 
И 
A єл 


ЖР SRE REAP, т, 是 形式 类 型 参数 , 6, 是 概念 子 句 . 概念 子 句 可 
以 有 如 下 三 种 形式 : 


1. 前 面 已 定义 的 概念 的 应 用 , 说 明 相 应 类 型 参数 的 一 个 子 集 建 模 此 概念 . 


2. 类 型 属性 、 类 型 函数 或 者 过 程 签 名 , 建 模 相应 概念 的 类 型 里 必须 有 它们 . 
过 程 签名 的 形式 是 f:T 一 T', 其 中 T 是 过 程 的 定义 域 而 T' 是 其 值 域 . 类 型 
函数 签名 的 形式 是 F:e C, 其 定义 域 和 值 域 都 是 概念 . 


3. 基于 这 些 类 型 属性 、 类 型 函数 和 过 程 表述 的 公理 . 


我 们 有 时 也 在 第 二 类 概念 子 句 里 的 类 型 属性 、 类 型 函数 或 过 程 的 签名 之 
后 包含 它们 的 定义 . 这 种 定义 的 形式 是 xm F(x), 其 中 的 了 是 表达 式 . 在 特定 模 
型 里 , 这 一 定义 可 以 被 另 一 个 不 同 的 但 与 之 协调 的 实现 所 覆盖 . 
举 个 例子 , 下 面 概念 描述 的 是 一 元 函数 式 过程 : 
UnaryFunction(F) È 
FunctionalProcedure(F) 
^ Arity(F) 21 
^ Domain : UnaryFunction — Regular 
F i> InputType(F, 0) 


下 面 概念 描述 的 是 同 源 的 函数 式 过 程 : 


HomogeneousFunction(F) 全 
FunctionalProcedure(F) 
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^ Arity(F) > 0 
^ (Vi,j € N)(i,j < Arity(F)) = (InputType(F, i) = InputType(F, j)) 
^ Domain : HomogeneousFunction — Regular 

F  InputType(F, 0) 


应 该 看 到 
(VF € FunctionalProcedure) UnaryFunction(F) = HomogeneousFunction(F) 


抽象 (abstract) 过 程 指 用 类 型 和 常量 参数 化 的 过 程 , 带 有 对 这 些 参数 的 要 
KE 下 面 将 为 此 使 用 函数 模板 和 函数 对 象 模板 . 参数 放 在 template 关键 字 后 
面 , 类 型 参数 用 typename 引入 , 常量 值 用 int 或 其 他 整数 类 型 名 引入 . 对 函数 
的 需求 通过 requires 子 句 严格 描述 , 该 子 句 的 内 容 是 一 个 表达 式 , 基于 常量 
值 、 具 体 类 型 、 形 式 参数 、 类 型 属性 和 类 型 参数 的 应 用 , 值 和 类 型 的 相等 , 相 
关 概 念 , 以 及 逻辑 连接 词 等 描述 7 

这 里 是 一 个 抽象 过 程 的 例子 : 


template<typename Op> 

requires (Binary0peration(Op) ) 
Domain(Op) square(const Domain(Op)& x, Op op) 
{ 


return op(x, x); 


定义 域 里 的 值 可 能 很 大 , 所 以 这 里 通过 常量 引用 的 方式 传递 该 参数 . 操作 
一 般 说 比较 小 (例如 是 函数 指针 或 很 小 的 函数 对 象 ), 因此 用 值 方式 传递 . 

概念 描述 的 是 一 个 类 型 的 所 有 对 象 都 满足 的 性 质 , 其 中 的 前 条 件 (ртесоп- 
dition) 描述 特定 对 象 的 性 质 . 举例 说 , 一 个 过 程 可 能 要 求 它 的 某 个 参数 是 素数 ， 
对 整数 类 型 的 这 一 需求 就 需要 用 一 个 概念 描述 , 其 中 的 素数 性 质 用 一 个 前 条 
HR. 函数 指针 的 类 型 只 描述 了 它 的 签名 , 未 描述 其 语义 性 质 . 例如 , 一 个 过 
6. 本 质 上 具有 我 们 所 采用 的 形式 的 抽象 过 程 出 现在 1930 van der Waerden [1930], 基于 Emmy 
Noether 和 Emil Artin 的 演讲 , George Collins 和 David Musser 20 世纪 60 年 代 后 期 和 70 年 代 
前 期 的 论文 在 计算 机 代数 的 研究 中 使 用 了 它们 . 例如 可 以 参考 Musser [1975]. 
T.requires 子 句 的 完整 语法 见 附录 B. 
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程 可 能 要 求 它 的 一 个 参数 是 指向 函数 的 指针 , 并 要 求 函数 实现 的 是 整数 上 的 
一 个 可 结合 的 二 元 运算 . 有 关 整 数 上 二 元 运算 的 要 求 可 以 用 一 个 概念 描述 , 而 
函数 的 结合 性 用 一 个 前 条 件 描述 . 

为 一 集 类 型 定义 一 个 前 条 件 , 需要 使 用 一 些 数 学 记 法 , 例如 全 称 和 存在 量 
dg, 蕴涵 等 . 举例 说 , 要 描述 整数 的 素数 性 质 , 用 下 面 定义 


property(N : Integer) 
prime : N 
n e (Inl #1) Л (Уу € N)uv =n > (lu 2 1V|v = 1) 
这 里 的 第 一 行 引入 了 一 些 形式 类 型 参数 和 它们 建 模 的 概念 , 第 二 行 说 明 一 个 
性 质 并 给 出 其 签名 , 第 三 行 是 描述 有 关 的 参数 应 满足 的 特定 性 质 的 谓词 . 
一 元 函数 式 过 程 的 规范 性 可 以 定义 如 下 


property(F : UnaryFunction) 
regular unary. function : F 
f ++ (Wf! € F)(Vx, x’ € Domain(F)) 
(f =f Ax = x!) = (f(x) = f'([x”)) 


这 一 定义 很 容易 扩充 到 n 元 函数 : 将 相等 的 函数 作用 于 相等 的 参数 得 到 
相等 的 结果 . 通过 扩充 , 我 们 要 求 规范 的 抽象 函数 的 所 有 实例 化 也 都 是 规范 的 . 
除非 男 有 说 明 , 本 书后 面 说 到 过 程 时 都 是 指 规范 过 程 , 因此 下 面 讨论 中 将 不 明 
确 写 出 这 一 前 条 件 . 


JH 1.1 请 将 相等 、 赋 值 、 赋 值 构造 操作 扩充 到 不 同类 型 的 对 象 上 . 请 考虑 
两 个 类 型 的 解释 和 联系 起 跨 类 型 的 过 程 的 公理 . 


1.8 总 结 


人 们 公认 的 对 于 现实 世界 的 许多 常识 在 计算 机 里 都 有 所 表现 . 通过 将 值 和 对 
象 的 意义 落实 到 它们 的 解释 , 可 以 得 到 一 种 简单 而 具有 内 在 一 致 性 的 看 法 . 如 
果 将 对 应 的 实体 纳入 我 们 的 考虑 , 各 种 设计 决策 (例如 如 何 定义 相等 ) 就 会 变 
得 直接 而 清晰 . 
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变换 及 其 轨道 


Ж.а 从 一 个 类 型 到 它 自身 的 规范 函数 . 从 一 个 初始 值 开 始 
连续 应 用 一 个 变换 , 就 得 到 了 这 个 值 的 轨道 . 我 们 要 实现 一 个 能 确定 轨道 结构 
的 算法 , 它 只 依赖 于 变换 的 规范 性 和 轨道 的 有 穷 性 . 这 个 算法 可 以 应 用 到 不 同 
的 领域 . 例如 , 可 以 用 它 检 查 一 个 链接 表 是 否 为 循环 的 , 或 用 于 分 析 一 个 伪 随 机 
数 生成 器 . 我 们 将 为 这 一 算法 推导 出 一 套 接 口 , 形式 上 是 一 集 过 程 及 其 参数 和 
结果 的 定义 . 对 轨道 结构 算法 的 分 析 , 使 我 们 可 以 用 最 简单 的 方式 介绍 自己 的 
编程 方法 . 


2.1 变换 


虽然 从 任意 一 组 类 型 到 任意 类 型 的 函数 都 存在 , 但 是 有 些 具 有 特殊 签名 的 函 
数 类 更 为 常用 . 本 书 中 经 常用 的 是 两 类 函数 : 同 源 谓 词 和 同 源 运算 . 同 源 谓词 
在 形式 上 都 是 Tx … xT 一 bool; 同 源 运算 都 是 形 如 Tx… xT 一 T 的 函数 . 一 
般 而 言 存在 着 任意 的 n 元 谓词 和 nm 元 运算 , 但 实际 中 遇 到 最 多 的 还 是 一 元 和 
二 元 的 同 源 谓词 , 一 元 和 二 元 的 同 源 运 算 . 

谓词 是 返回 真 值 的 函数 : 


Predicate(P) = 
FunctionalProcedure(P) 
A Codomain(P) = bool 


同 源 谓词 也 是 同 源 函 数 : 


HomogeneousPredicate(P) 全 
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Predicate(P) 
人 HomogeneousFunction(P) 


一 元 谓词 具有 一 个 参数 : 


UnaryPredicate(P) 全 
Predicate(P) 
^ UnaryFunction(P) 


运算 是 同 源 函 数 , 其 值 域 与 作用 域 相同 : 


Operation(Op) 全 
HomogeneousFunction(Op) 
A Codomain(Op) = Domain(Op) 


下 面 是 几 个 同 源 运算 的 实例 : 


int abs(int x) { 
if (x < 0) return -x; else return x; 


} // 一 元 运算 


double euclidean norm(double x, double y) { 
return sqrt(x * x + y * y); 


y // 二 元 运算 


double euclidean norm(double x, double y, double z) { 
return sqrt(x * x +y *y +z * z); 


) // 三 元 运算 
引 理 2.1 euclidean. norm(x, y, z) = euclidean_norm(euclidean_norm(x, у), z) 


这 一 引 理 说 明 上 面 的 三 元 运算 可 以 从 相应 的 二 元 版 本 得 到 . 但 是 , 由 于 效 
Ж, 表达 方便 , 或 者 准确 性 等 原因 , 这 样 的 三 元 运算 也 可 以 纳入 处 理 三 维 空间 的 
程序 的 计算 基 . 

如 果 一 个 过 程 的 定义 空间 是 其 输入 类 型 的 直 积 的 子 集 , 就 称 该 过 程 为 部 分 
的 (partial); 如 果 其 定义 空间 等 于 其 输入 类 型 的 直 积 , 则 说 它 是 全 的 . 按 标准 的 
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数学 习惯 , 我 们 也 认为 部 分 过 程 包括 全 过 程 , HKM EREE АР 27 SERE A 4E 
全 的 (nontotal). 由 于 计算 机 表示 的 有 穷 性 , 有 些 全 函数 在 计算 机 里 的 实现 却 是 
非 全 的 . 例如 , 有 符号 的 32 位 整数 加 法 就 是 非 全 的 . 

一 个 非 全 过 程 需要 有 一 个 描述 其 定义 空间 的 前 条 件 . 要 验证 对 这 个 过 程 
的 一 个 调用 是 正确 的 , 必须 确定 所 给 的 实 参 满足 这 一 前 条 件 . 有 时 我 们 会 把 部 
分 过 程 作为 参数 传 给 一 个 算法 , 因此 需要 在 运行 时 确定 这 种 过 程 参数 的 定义 
空间 问题 . 为 了 处 理 这 类 情况 , 我 们 将 定义 一 个 定义 空间 谓词 (definition space 
predicate), 它 与 这 一 过 程 参数 的 输入 相同 , 当 且 仅 当 实际 输入 在 这 个 过 程 的 定 
义 空间 里 时 , 让 这 个 谓词 返回 真 . 在 调用 一 个 非 全 过 程 之 前 , 或 者 其 前 条 件 必 
须 满足 , 或 者 该 调用 是 用 这 个 过 程 的 定义 空间 谓词 保护 的 . 


练习 2.1 请 为 32 位 有 符号 整数 的 加 法 实现 一 个 定义 空间 谓词 . 
本 章 研究 一 元 运算 , 我 们 称 其 为 变换 (transformation): 


Transformation(F) 全 
Operation(F) 
A UnaryFunction(F) 
^ DistanceType : Transformation — Integer 


这 里 的 DistanceType 将 在 下 一 节 讨论 . 

变换 可 以 自 组 合 (self composable), 例如 可 以 写 f(x), f(f(x)), f(f(f(x))), 4848. 
f(f(x)) 的 定义 空间 是 f 的 定义 空间 和 结果 空间 的 交 . 这 种 自 组 合 能 力 和 检查 相 
等 能 力 的 结合 , 使 我 们 可 以 定义 许多 有 趣 的 算法 . 

设 f 是 一 个 变换 , TH (power) 定义 如 下 : 


x if n=0, 
Pg= 
wm ifn>0 


要 实现 计算 f"(x) 的 算法 , 就 要 描述 对 一 个 整数 类 型 的 需求 . 第 5 章 将 研究 
描述 与 整数 有 关 的 一 些 概念 , 现在 我 们 暂时 依靠 对 整数 的 一 些 直观 理解 . 有 符 
号 和 无 符号 的 整数 类 型 都 是 整数 的 模型 , 还 有 任意 精度 的 整数 等 , 它们 都 包含 
下 面 的 运算 和 文字 量 : 


Download at htip: //werw pinSi.com, 





18 第 2 章 变换 及 其 轨道 

规程 | C++ 

加 + + 

v — = 

R Р * 

除 / ў 

取 模 | mod | X 

= 0 I(0) 

= 1 IG) 

= 2 I(2) 








其 中 的 1 是 一 个 整数 类 型 . 
这 样 就 可 以 写 出 下 面 算法 : 
template<typename F, typename N> 
requires(Transformation(F) && Integer(N)) 


Domain(F) power-unary(Domain(F) x, Nn, F f) 


1 
// WEE: n 20A^(VieN)0cicno f(x) FEM 
while (n != N(0)) 4 
n= n - N(1); 
x = f(x); 
Ë 
return x; 
f 
22 轨道 


要 理解 一 个 变换 的 全 局 行为 , 可 以 考察 其 轨道 (orbit) 的 结构 . 所 谓 变换 的 轨道 ， 
就 是 从 一 个 开始 元 素 出 发 , 通过 反复 应 用 这 一 变换 能 到 达 的 所 有 元 素 . 如 果 对 
某 个 n>0 有 y= 人 "(x), 就 说 y 是 从 x 出 发 在 变换 f 下 可 达 的 (reachable). 如 果 
有 某 个 n>1 使 x=f"(x), 就 说 x 在 f 下 是 环 路 的 (cyclic). 如 果 x 不 在 f 的 定 
义 空间 里 , 称 x 在 f 下 是 终止 点 (terminal). x 在 变换 f 下 的 轨道 (orbit) 就 是 x 
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在 f 下 可 达 的 所 有 元 素 的 集合 . 
引 理 2.2 一 条 轨道 不 会 同时 包含 环 路 元 素 和 终止 元 素 . 
引 理 2.3 一 条 轨道 至 多 包含 一 个 终止 元 素 . 


如 果 元 素 4 AM x EF FAK, 从 x 到 vy 的 距离 (distance) 定义 为 从 x 得 到 
у 的 最 小 的 变换 步 数 . 显然 , 距离 并 不 总 有 定义 . 

给 定 变换 类 型 F, 类 型 DistanceType(F) 是 一 个 足够 大 的 整数 类 型 , 足以 表 
示 任 何 变换 feF 从 T= Domain(F) 的 一 个 元 素 到 另 一 元 素 的 最 大 变换 步 数 . 如 
果 类 型 T 用 个 二 进 制 位 表示 , ERA 2* MA, 而 不 同 值 之 间 只 有 2* 一 1 个 变 
Ж. 这 样 , 如 果 T 是 固定 大 小 的 类 型 , 同样 大 小 的 整数 类 型 就 能 作为 表示 T 上 
任意 变换 的 距离 的 合法 类 型 . (可 以 不 用 距离 类 型 , 而 是 在 power unary 里 用 任 
意 整 数 类 型 , 因为 这 种 额外 推广 不 会 在 这 里 造成 问题 .) 一 种 常见 情况 是 同一 定 
义 域 上 的 变换 都 具有 同样 的 距离 类 型 . 这 时 类 型 函数 DistanceType 就 对 这 一 定 
义 域 类 型 有 定义 , 定义 了 与 相关 变换 类 型 对 应 的 类 型 函数 . 

如 果 类 型 函数 DistanceType 存在 , 就 可 以 写 出 下 面 过 程 : 


template<typename F> 
requires(Transformation(F)) 
DistanceType(F) distance(Domain(F) x, Domain(F) y, F f) 
{ 
// 前 条 件 :y # € 下 从 x TE 
typedef DistanceType(F) N; 
N n(0); 
while (x != y) { 
x= f(x); 
n =n + N(1); 
} 


return n; 


轨道 有 不 同 的 形状 . x 在 某 变 换 下 的 轨道 可 以 是 
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图 21 轨道 的 形状 


无 穷 的 ”车 它 既 不 是 终止 的 也 没有 环 路 

终止 的 若 它 有 一 个 终止 元 素 

环 路 的 若 x 是 环 路 的 

p 形 的 车 x 本 身 不 是 环 路 的 ,但 它 的 轨道 包含 环 路 元 素 
in x 的 轨道 不 是 无 穷 的 , 它 就 是 有 穷 的. 图 2.1 给 出 了 轨道 的 各 种 情况 . 

轨道 环 (cycle of orbit) 是 轨道 的 一 集 元 素 , 规定 轨道 为 无 穷 或 终止 时 其 环 

为 空 . 轨道 柄 (handle of orbit) 是 轨道 里 除去 环 之 外 的 部 分 , 环 路 轨道 的 柄 为 
3, 连接 点 (connection point of orbit) 是 轨道 上 的 第 一 个 环 路 元 素 , 对 环 路 轨道 
取 其 第 一 个 元 素 , 对 o 形 轨道 是 轨道 柄 之 后 的 第 一 个 元 素 . 轨道 规模 (size of 
orbit) o 是 轨道 中 不 同 元 素 的 个 数 ; 轨道 的 柄 规模 (handle size) n. 是 轨道 柄 中 元 
素 的 个 数 ; 环 规模 (circle size) с 是 轨道 环 中 元 素 的 个 数 . 


引 理 2.40=h+c 
引 理 2.5 从 轨道 中 任意 一 点 到 该 轨道 的 环 路 中 任意 一 点 的 距离 都 有 定义 . 
引 理 2.6 35 x 和 vy 是 规模 为 的 环 里 的 两 个 不 同 点 , 那么 


с = distance(x, y, f) + distance(y, x, f) 
引 理 2.7 35 x ЯП у 是 规模 为 c 的 环 的 两 个 不 同 点 , x By 的 距离 满足 


0 < distance(x, y, f) < c 
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23 碰撞 点 


如 果 不 知道 定义 而 只 能 观察 其 行为 , 我 们 无 法 确定 一 个 变换 的 一 条 特定 轨道 
BREED, 因为 它 完全 可 能 在 任意 一 点 结束 或 者 循环 . 如 果 知 道 一 条 轨道 是 有 
穷 的 , 那 就 可 以 用 一 个 算法 来 确定 该 轨道 的 形状 了 . 因此 , 本 章 针对 轨道 的 所 
有 算法 都 有 一 个 有 关 轨 道 有 穷 性 的 隐 含 前 条 件 . 

显然 可 以 写 一 个 简单 而 平凡 的 算法 , 让 它 保 存 已 访问 的 每 个 元 素 , 在 每 一 
步 检查 新 遇 到 的 元 素 是 否 曾经 访问 过 . 虽然 可 以 用 哈 希 技 术 来 加 快 搜索 , 但 这 
个 算法 至 少 需要 线性 的 存储 空间 , 而 这 种 要 求 对 于 许多 实际 应 用 是 不 能 接受 
的 . 还 好 , 存在 着 只 需要 常量 存储 空间 的 算法 . 

下 面 的 类 比 有 助 于 理解 这 一 算法 . 如 果 有 一 辆 速度 快 的 汽车 和 一 辆 速度 
慢 的 汽车 在 一 条 道路 上 行驶 , 当 且 仅 当 存在 环 路 时 快车 将 能 追 上 慢车 . 如 果 没 
有 环 路 , 快车 将 比 慢车 先 到 达 道 路 的 终点 . 如 果 有 环 路 , 在 慢车 进入 环 路 之 后 ， 
快车 一 定 会 在 环 路 中 追 上 它 . 下 面 我 们 把 这 种 直观 想法 从 连续 域 转 到 离散 域 ， 
还 要 小 心地 避免 快车 超过 慢车 :! 

这 一 算法 的 离散 版 本 基于 找到 快车 遭遇 慢车 的 点 . 变换 f 和 起 始点 x Hh 
定 的 碰撞 点 (collision point) 就 是 那个 唯一 的 y, 它 使 


у= f(x) = P*!() 


其 中 的 n>0 是 满足 这 一 条 件 的 最 小 整数 . 这 一 定义 给 出 了 一 个 用 于 确定 轨道 
结构 的 算法 , 它 只 需 比较 较 快 的 迭代 和 较 慢 的 和 迭代. 如果 要 处 理 的 是 部 分 变换 ， 
那 就 必须 给 算法 送 一 个 定义 空间 谓词 : 
template<typename F, typename P> 

requires(Transformation(F) && UnaryPredicate(P) && 

Domain(F) == Domain(P)) 

Domain(F) collision.point(const Domain(F)& x, F f, P p) 
1 

// BEA TE: р(х) e f(x) 有 定义 

if (!p(x)) return x; 

Domain(F) slow = x; // slow = #0(х) 





1. Knuth [1997,7 Д] 将 这 一 算法 归功 于 Robert W. Floyd. 
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Domain(F) fast = f(x); // fast = f1(x) 
//n 一 0 GE RR C) 
while (fast != slow) { // slow = f"(x) A fast = f2"+1(x) 
slow = f(slow); // slow = "*1(x) A fast = f2"+1(x) 
if (!p(fast)) return fast; 
fast = f(fast); // slow = fr+l(x] A fast = f2"+2(x) 
if (!p(fast)) return fast; 
fast - f(fast); // slow = f**! (x) A fast = f?^*3(x) 
Mn 一 n+1 
} 
return fast; // slow = {“(х) A fast = f2"+1(x) 


// 后 条 件 : Ж |P] # Ak BA f yx BU ME 


我 们 将 通过 三 个 步骤 来 确立 collision_point 算法 的 正确 性 : (1) 验证 f 不 会 
被 应 用 于 定义 空间 之 外 的 参数 ; (2) 验证 如 果 它 终止 , 后 条 件 一 定 满足 ; 以 及 (3) 
验证 它 必定 终止. 

即使 f 是 部 分 函数 , 它 在 这 一 过 程 中 的 使 用 也 总 是 良 定义 的 , 因为 fast 的 
移动 受到 p 调用 的 保护 . 而 slow 的 移动 不 需要 保护 , 这 是 由 于 f 的 规范 性 : 
slow 和 fast 在 同一 轨道 上 , 所 以 将 f 应 用 于 slow 时 总 有 定义 . 

算法 里 的 注释 说 明 , 如 果 经 过 mn > 0 次 迭代 后 fast 变 得 等 于 slow, 那 就 一 
EH fast = f?! (x) 和 slow = f^(x). 进一步 说 , n 就 是 满足 这 一 条 件 的 最 小 整 
数 , 因为 对 每 个 i<n 都 已 经 检查 过 这 个 条 件 . 

如 果 没 有 环 路 , 由 于 有 穷 性 , р 将 最 终 返 回 假 . 如 果 有 环 路 , slow 最 终 将 到 
达 连 接点 ( 环 路 的 第 一 个 点 ). 在 程序 里 的 循环 语句 开始 处 考虑 当 slow 刚 进入 
环 路 时 从 fast 到 slow 的 距离 d, # 0 < a < c. ШЖ a = 0 过 程 立即 结束 . 否则 
从 fast 到 slow 的 距离 在 每 次 迭代 中 减 1. 这 就 说 明 该 过 程 总 会 终止 , 而 当 其 终 
JER} slow 移动 了 总 共 h+d zp. 

下 面 过 程 确定 一 条 轨道 是 否 终止: 


template<typename F, typename P> 
requires(Transformation(F) && UnaryPredicate(P) && 
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Domain(F) == Domain(P)) 
pool terminating(const Domain(F)& x, F f, P p) 
$ 
// BWR FE: р(х) өх) 有 定义 


return !p(collision point(x, f, p)); 


有 时 我 们 知道 一 个 变换 或 者 是 全 的 , 或 者 从 某 个 特定 开始 点 出 发 的 轨道 是 
不 终止 的 . 对 于 这 种 情况 , 下 面 特殊 版 本 的 collision. point 会 很 有 用 : 


template<typename F> 
requires(Transformation(F)) 
Domain(F) 
collision.point nonterminating orbit(const Domain(F)& x, F f) 


{ 


Domain(F) slow = x; // stow = f(x) 
Domain(F) fast = f(x); // fast = f(x) 
//n 0 (FERRET) 
while (fast != slow) { // stow = f^(x) A fast = fr+l(x) 
slow = f(slow); // stow = f^*! (x) A fast = f2"+1(x) 
fast = f(fast); // slow = (х) A fast = f2"+2(x) 
fast = f(fast); // slow = (х) A fast = fzn+3(x) 
[nm 一 nm 十 1 
} 
return fast; // slow = f^(x) ^ fast = f2"+1(x) 


// 后 条 件 : 3E ЕЙ кї AS fE 


要 想 确定 环 路 的 结构 , 即 确定 轨道 的 柄 规模 、 连 接点 和 环 规模 , 就 需要 分 
析 磁 撞 点 的 位 置 . 


当 过 程 返回 碰撞 点 时 


f"(x) = f2"+1(x) 
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其 中 m 是 slow 走 过 的 步 数 , n+1 是 fast 走 过 的 步 数 . 而 且 
n=h+d 
这 里 的 h 是 柄 规模 , 0 < d < c 是 slow 在 环 里 走 过 的 步 数 . fast EMH ME 
2n+1=h+d+qc 
这 里 的 q> 0 是 fast MB slow 时 完成 整个 环 的 次 数 . HF n = h + d, 所 以 
2h+d)+1=h+d+ae 


通过 化 简 得 到 
qc=h+d+1 
用 下 式 表 示 nO c 取 模 : 


h=me+r 


其 中 0<r<ec. 代 换 给 出 
qc=me+r+d+1 


也 就 是 
d=(q—m)c—r—1 
O<d<c RRA 
а-т=1 
所 以 
d-c—r-1 


WARE r+ 1 步 去 完成 整个 环 . 
这 样 , 从 碰撞 点 到 连接 点 的 距离 就 是 


е=т+1 
对 环 路 轨道 有 h = 0 B. r= 0, JA RE A BMT tB ОВЕ EJ 
е=1 


由 此 可 知 , 环 路 性 质 可 以 用 下 面 过 程 检查 : 
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template<typename F> 
requires(Transformation(F)) 
bool circular.nonterminating orbit(const Domain(F)& x, F f) 
1 
return x == f(collision point nonterminating orbit(x, f)); 


} 


template<typename F, typename P> 
requires(Transformation(F) && UnaryPredicate(P) && 
Domain(F) == Domain(P)) 


bool circular(const Domain(F)& x, F f, P p) 


< 
// W ff: р(х) e f(x) 有 定义 
Domain(F) y = collision_point(x, f, p); 
return p(y) && x == f(y); 

У 


至 此 仍 不 可 能 知道 柄 规模 h 和 环 规模 c. 在 知道 碰撞 点 之 后 很 容易 确定 后 
者 , 为 此 只 需 遍 历 环 路 一 次 并 记录 步 数 . 
要 想 确 定 h, 先 看 看 碰撞 点 的 位 置 : 


fn+a(x] = fh+te- 一 1(x] = fme+r+e-r-l(x] = f(m+1)e—1(x) 


从 冲突 点 走 h+1 步 就 到 达 了 点 HDH), 它 等 于 个 (x), 因为 (m + 1)e 对 应 
FRR m+1 次 . 如果 同时 从 x 走 h 步 并 从 碰撞 点 走 h+1 步 , 两 者 就 会 在 连接 
点 相遇 . 换 名 话说, x 的 轨道 和 过 碰撞 点 1 步 的 点 在 恰好 h 步 后 汇合 , 这 一 情况 
揭示 了 下 面 几 个 算法 : 


template<typename F> 
requires (Transformation(F) ) 
Domain(F) convergent point(Domain(F) x0, Domain(F) xi, F f) 
í 
// 前 条 件 : (Эп € DistanceType(F)) n > 0 人 fn(x0) = ft(x1) 
while (xO != x1) í 
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x0 = £(x0); 
[xi = #(х1); 
J 
return x0; 
} 


template<typename F> 
requires (Transformation(F) ) 
Domain(F) 
connection point nonterminating orbit(const Domain(F)& x, F f) 
{ 
return convergent point( 
x, 
f(collision point nonterminating orbit(x, f)), 
f); 


template<typename F, typename P> 
requires(Transformation(F) && UnaryPredicate(P) && 
Domain(F) == Domain(P)) 
Domain(F) connection_point(const Domain(F)& x, F f, P p) 
{ 
// WAH: р(х) f(x) 有 定义 
Domain(F) y = collision_point(x, f, p); 
if (!p(y)) return y; 
return convergent point(x, f(y), f); 


8138 2.8 如 果 两 个 元 素 的 轨道 相交 , 它们 将 有 同样 的 环 路 元 素 . 


练习 2.2 请 设计 一 个 算法 , 对 于 给 定 的 变换 和 定义 空间 谓词 , 它 能 确定 两 个 元 
素 的 轨道 是 否 相交 . 
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练习 2.3 convergent. point 的 前 条 件 保 证 它 终止 . 请 针对 没有 该 条 件 , 但 己 知 在 
两 点 x0 和 x1 的 轨道 上 有 共同 元 素 的 情况 实现 算法 convergent. point. guarded. 


2.4 轨道 规模 的 度量 


对 于 类 型 T 上 的 轨道 , 有 关 规 模 o, h A c 的 自然 类 型 应 该 是 一 个 足以 记录 类 型 
T 中 所 有 不 同 的 值 的 个 数 的 整数 计数 类 型 . 如 果 类 型 T 占 了 k 位 , 它 至 多 有 2* 
个 值 , 所 以 一 个 k 位 的 计数 类 型 将 不 能 表示 从 0 到 25 的 所 有 计数 值 . 但 在 使 用 
距离 类 型 时 有 一 种 表示 这 些 规模 的 方法 . 

一 条 轨道 有 可 能 包含 某 类 型 的 所 有 值 , 这 时 o 就 可 能 无 法 存 入 相应 的 距离 
类 型 . 对 不 同形 状 的 轨道 , h BR c 也 可 能 无 法 存 入 . 然而 对 p- 形 轨道 ,h 和 cc 一定 
能 存 入 . 对 所 有 情况 下 面 几 个 量 都 可 以 存 入 : o 一 1 (轨道 中 的 最 大 距离 ), h 一 1 
( 柄 里 的 最 大 距离 ), 以 及 c 一 1 ( 环 里 的 最 大 距离 ). 这 使 我 们 可 以 实现 一 个 过 程 ， 
它 返 回 一 个 三 元 组 来 表示 轨道 的 完整 结构 , 其 三 个 成 员 分 别 是 : 














情况 | m0 | ml m2 
&i|n-1| о | 终止 元 素 
环 路 | 0 [e-1 x 
p 形 | n |с-1| 连接 点 











template<typename F> 
requires(Transformation(F)) 
triple<DistanceType(F), DistanceType(F), Domain(F)> 
orbit_structure nonterminating_orbit(const Domain(F)& x, F f) 
t 
typedef DistanceType(F) N; 
Domain(F) y = connection point nonterminating orbit(x, f); 
return triple<N, N, Domain(F)>(distance(x, y, f), 
distance(f(y), y, £), 
y; 
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template<typename F, typename P> 
requires(Transformation(F) && 
UnaryPredicate(P) && Domain(F) == Domain(P)) 
triple<DistanceType(F), DistanceType(F), Domain(F)> 
orbit structure(const Domain(F)& x, F f, P p) 
t 
// 前 条 件 : p(x) © t(x) 有 定义 
typedef DistanceType(F) N; 
Domain(F) y = connection point(x, f, p); 
N n 7 distance(x, y, £); 
N n(0); 
if (p(y)) n = distance(f(y), y, f); 
// Sik tt: m=n-1An=0 
// BM: m-hA^n-c-1 
return triple<N, N, Domain(F)>(m, n, y); 
} 


练习 2.4 请 推导 出 本 章 各 算法 中 使 用 不 同 操作 (f, p, 相等 ) 的 次 数 的 公式 . 


练习 2.5 用 orbit structure nonterminating orbit 确定 在 你 所 使 用 的 平台 上 的 伪 随 
机 数 生成 器 对 不 同 种 子 值 的 平均 柄 规模 和 环 路 规模 . 


2.5 动作 
在 算法 里 , 变换 f 经 常 被 用 在 如 下 形式 的 语句 中 
x = f(x); 


应 用 变换 去 改变 对 象 的 状态 , 就 定义 了 相应 对 象 上 的 一 个 动作 (action). Ж 
换 和 动作 之 间 有 直接 的 对 偶 关 系 , 可 以 基于 变换 来 定义 动作 , RLM: 


void a(T& x) { x = f(x); р // 从 变换 定义 动作 
以 及 
T f(T x) { a(x); return x; ) // 从 动作 定义 变换 
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虽然 存在 这 种 对 偶 关 系 , 但 有 时 独立 的 实现 效率 更 高 , 这 种 情况 下 就 应 该 
分 别提 供 动作 和 变换 . 举例 说 , 如 果 在 很 大 的 对 象 上 定义 变换 , 但 是 只 修改 整个 
状态 中 很 小 的 一 部 分 , 采用 动作 定义 就 可 能 大 大 提高 效率 . 


练习 2.6 请 用 动作 的 方式 重 写本 章 的 各 个 算法 . 


项 目 2.1 检查 环 路 的 另 一 种 方式 是 反复 检查 一 个 不 断 更 新 的 元 素 是 否 与 另 一 
个 保存 着 的 元 素 相等 , 与 此 同时 按 一 定 间隔 更 新 那个 保存 的 元 素 . Sedgewick 
et al. [1982], Brent [1980] 和 Levy [1982] 讨论 了 这 种 想法 和 其 他 想法 . 请 为 轨道 
分 析 写 一 些 算法 , 针对 不 同 应 用 比较 它们 的 性 能 , 并 为 选择 适当 的 算法 提出 一 
组 建议 . 


2.6 总 结 


抽象 使 我 们 可 以 定义 出 一 些 能 用 于 不 同 领域 的 抽象 过 程 . 规范 性 和 函数 的 类 
型 在 这 里 起 着 最 重要 的 作用 : fast 和 slow 能 走 同一 条 轨道 的 基础 就 是 规范 性 . 
开发 一 批 专 有 术语 (例如 , 轨道 的 类 型 和 规模 ), 是 最 基础 最 重要 的 工作 . 一 些 附 
属 类 型 , 例如 距离 类 型 , 也 需要 精确 地 定义 . 
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Be oessusnssax 可 结合 性 使 人 可 以 重组 相 邻 的 运算 , 基于 这 
种 重组 能 力 可 以 得 到 一 个 计算 二 元 运算 的 轿 的 有 效 算法 . 规范 性 使 我 们 可 以 
用 许多 程序 变换 来 优化 这 一 算法 . 我 们 随后 要 利用 该 算法 在 对 数 时 间 里 计算 
各 种 线性 递归 , #| do Ж SE Жл иҗ. 


31 可 结合 性 
二 元 运算 是 有 两 个 参数 的 运算 : 
BinaryOperation(Op) 全 
Operation(Op) 
^ Arity(Op) = 2 
二 元 的 加 法 和 乘法 是 数学 的 核心 概念 , 常用 的 这 类 东西 很 多 , 如 求 较 小 或 
较 大 的 值 , 合 取 和 析 取 , 集合 的 交 与 并 等 . 这 些 运算 都 是 可 结合 的 (associative): 
property(Op : BinaryOperation) 
associative : Op 


op њ (Va, b, c € Domain(op)) op(op(a, b). c) = op(a, op(b, c)) 


当然 , 也 存在 不 可 结合 的 二 元 运算 , 例如 除法 和 减法 . 

如 果 根 据 上 下 文 完全 可 以 看 清 所 用 的 可 结合 二 元 运算 op, 我 们 常用 隐 式 
的 乘法 记 法 将 其 写成 ab 而 不 是 op(a,b). 由 于 可 结合 性 , 在 涉及 两 次 或 多 次 应 
用 op 的 表达 式 里 不 需要 括号 , 因为 所 有 分 组 方式 都 等 价 : (… (aoai) -Jan = 
+++ = ао(---(а„—2а„—1)---) = agar---a,-1- {4 ao = а =--- = а, = a 时 将 其 
写成 a", KH a 的 n ЖЖ (power). 
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引 理 3.1 a^a" = a"a^ = a^*" (同一 元 素 的 血 可 交换 .) 
引 理 3.2 (anjm = a^" 


当然 , (ab)" = a^b^ 未 必 总 成 立 , 只 在 运算 还 可 以 交换 时 成 立 . 
如 果 f 和 9 是 同一 定义 域 上 的 变换 , 它们 的 复合 (composition) g o f 也 是 一 
个 变换 , 将 x 映射 到 g(f(x)). 


引 理 3.3 二 元 运算 的 复合 是 可 结合 的 . 


在 可 结合 运算 op 的 定义 域 中 选 一 个 元 素 а, 并 把 表达 式 op(a x) HERA 
一 个 形 参 x 的 一 元 运算 , 就 可 以 把 a 看 作 是 一 个 “ 乘 以 a” 运算 . 这 说 明 可 以 采 
Ri 5 3388 BJ (^. 的 同样 记 法 , 将 一 个 元 素 在 可 结合 二 元 运算 下 的 写 记 为 a 是 
合适 的 . 这 一 对 偶 性 质 使 我 们 可 以 用 取 自 前 一 章 的 一 个 算法 , 证 明 一 个 有 关 可 
结合 运算 的 寒 的 有 趣 定理 . 如 果 对 某 个 可 结合 运算 , 存在 整数 0<n<m 使 
x" = x^, ШЖ x 在 该 运算 下 具有 有 穷 的 阶 (finite order). 如 果 对 某 可 结合 运算 
有 x=x2, 则 称 x 是 该 运算 的 界 等 元 素 (idempotent element). 


定理 3.1 — ` ff 93 Br TK LY Н — TS 3E (Frobenius [1895]). 


证 明 . W x 是 可 结合 运算 op 下 的 一 个 有 穷 阶 元 素 . > glz) = ор(х,2). HF x 的 
WAH, CE o 下 的 轨道 有 循环 . 根据 定理 的 条 件 , 存在 n > 0 使 得 


collision_point(x, g) = g"(x) = g2"+1(x) 
这 样 
g^(x) = x"*! 
д2 Ц) = x+? = +1) — ny 
而 且 x" 就 是 x SAR. Ë 


5138 3.4 也 可 以 在 上 面 的 证 明 里 用 collision. point nonterminating orbit. 


32 HERE 
对 可 结合 运算 op 计算 ar 的 算法 以 a, п 和 op 为 参数 , 这 里 a 的 类 型 是 op HE 
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SUR, n 必须 属于 某 个 整数 类 型 . 如 果 没 有 可 结合 性 假设 , 可 以 用 两 个 算法 分 别 
完成 从 左 到 右 或 从 右 到 左 的 计算 : 


template<typename I, typename Op> 

requires(Integer(I) &k BinaryOperation(0p)) 
Domain(Op) power left associated(Domain(O0p) a, I n, Op op) 
1 

// 前 条 件 :n>0 

if (n == I(1)) return a; 

return op(power.left associated(a, n - I(1), op), a); 
$ 


template<typename I, typename Op> 

requires(Integer(I) && BinaryOperation(0p)) 
Domain(Op) power_right_associated(Domain(Op) a, I n, Op op) 
{ 

// WEE: n> 0 

if (п == I(1)) return a; 


return op(a, power right associated(a, n - I(1), op)); 


这 两 个 算法 都 应 用 相应 的 运算 n 一 1 次 . 对 于 非 可 结合 的 运算 , 它们 可 能 
返回 不 同 结果 . 作为 例子 , 请 考虑 减法 运算 的 1 到 3 PORE IO HR. 

Ж а Al п 都 是 整数 而 运算 是 乘法 时 , 这 两 个 算法 给 出 的 都 是 乘 符 ; 运算 是 
加 法 时 两 个 算法 做 的 都 是 乘法 . 古 埃及 人 早已 发 现 了 更 快 的 乘法 算法 , 可 以 将 
其 推广 到 计算 任意 可 结合 运算 的 窜 .1 

可 结合 性 使 人 可 以 自由 地 将 运算 分 组 , 由 此 可 得 


a #Hn=1 
а^ = 4 (а2)"/2 Hn 是 偶数 
(а2)1"/2а 车 nn 是 奇数 





1. 源 自 Robins and Shute [1987, 16-17 页 ]; 莎 草 纸 古 写 本 的 大 致 年 代 是 公元 前 1650 F, 但 写本 
上 的 注 记 说 明 它 是 大 约 公元 前 1850 年 的 另 一 古 写 本 的 抄本 . 
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这 对 应 于 


template<typename I, typename Op> 
requires(Integer(I) && BinaryOperation(Op)) 
Domain(O0p) power_O(Domain(Op) a, I n, Op op) 


t 
// WHF: associative(op) An > 0 
if (п == I(1)) return a; 
if (n 4 I(2) == I(0) 
return power O(op(a, a), n / I(2), ор); 
return op(power_O(op(a, a), n / 1(2), ор), a); 
} 


现在 对 指数 n 算 一 下 power.0 执 行 运算 的 次 数 . 递归 调用 的 次 数 是 (log, п]. 
令 v 为 n 的 二 进 制 表示 里 1 的 个 数 . 每 次 递归 调用 执行 一 次 运算 求 a 的 平方 ， 
还 需要 v 一 1 次 额外 的 运算 调用 , 所 以 总 运算 次 数 是 


logan] + (v — 1) < 2|log2 n] 


WF п = 15, logan] = 3, 其 表示 中 有 4 个 1, 公式 给 出 的 是 6 次 运算 . 另 一 不 同 
分 组 方式 是 a! = (a3)5, 这 里 o? 做 2 次 运算 而 a 做 3 次 , 总 数 为 5. 对 另外 一 
些 指数 也 存在 更 快 的 分 组 方式 , 例如 对 23, 27, 39 和 43.2 

power.left associated 需要 做 n — 1 次 运算 , 而 power-0 最 多 做 2|logo n | 次 运 
Ж. 很 明显 , 对 于 较 大 的 n, power-0 总 是 快 得 多 . 但 事情 也 不 都 这 样 . 例如 , 要 
是 做 具有 任意 精度 整数 系数 的 一 般 多 项 式 的 乘法 , power left associated 会 更 快 
些 .3 还 有 , 即使 对 这 样 的 简单 算法 , 我 们 也 不 知道 如 何 精确 描述 一 种 复杂 性 需 
求 , 使 之 可 用 于 确定 两 者 中 哪个 更 好 . 


power-0 能 处 理 很 大 的 指数 , 如 10°, 这 使 它 在 密码 学 中 非常 重要 .4 





2. 有 关 最 小 运算 数 求 突 的 深入 讨论 见 Knuth [1997, 465-481 页 ]. 
3. 见 McCarthy [1986]. 
4. 见 Rivest et al. [1978] 中 有 关 RSA 的 工作 . 
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3.3 ”程序 变换 


power0 是 有 关 算 法 的 一 个 令 人 满意 的 实现 , 它 适 用 于 运算 的 代价 高 于 函数 递 
归 调 用 开销 的 情况 . 本 节 要 推导 出 一 个 迭代 算法 , 它 执 行 运算 的 次 数 和 power-0 
一 样 . 这 里 将 要 做 一 系列 程序 变换 , 这 些 变 换 也 可 以 用 在 其 他 许多 情况 中 .5 在 
本 书后 面 的 部 分 , 通常 将 只 给 出 算法 的 最 终 版 本 或 几乎 最 终 版 本 . 

ромег.0 包含 两 个 相同 的 递归 调用 , 它 每 次 只 执行 其 中 一 个 . 这 使 我 们 可 能 
通过 公共 子 表 达 式 删除 技术 来 缩小 代码 的 规模 : 
template<typename I, typename Op> 

requires(Integer(I) && BinaryOperation(0p)) 
Domain(Op) power_1(Domain(Op) a, I n, Op op) 


{ 
// BW £ fF: associative(op) An > 0 
if (п == I(1)) return a; 
Domain(Op) г = power i(op(a, a), n / 1(2), op); 
if (n % 1(2) != 1(0)) г = op(r, а); 
return т; 
} 


现在 的 目标 是 删除 递归 调用 , 为 此 要 做 的 第 一 步 是 把 过 程 变换 到 尾 递归 形 
式 (tail-recursive form), 其 中 在 过 程 执行 的 最 后 一 步 是 对 自身 的 递归 调用 . 完成 
该 变换 的 一 种 技术 是 引入 累积 变量 (accumulation-variable introduction), 用 于 在 
不 同 递归 调用 之 间 携 带 累积 的 结果 : 
template<typename I, typename Op> 

requires(Integer(I) && BinaryOperation(0p)) 
Domain(Op) power.accumulate O(Domain(0p) r, рошаіп(0р) a, I n, 


Op op) 


// ATÆ fF: associative(op) An > 0 
if (n == I(0)) return r; 





5. 只 有 在 运算 的 语义 和 复杂 性 已 知 的 情况 下 , 编译 器 才 会 对 一 些 内 部 类 型 做 类 似 变换 . 规范 性 
概念 是 类 型 创建 者 的 一 个 断言 , 它 保证 程序 员 和 编译 器 可 以 安全 地 执行 这 些 变换 . 
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if (n 4 102) != I(0) r = op(z, a); 


return power_accumulate_O(r, op(a, a), n / 1(2), op); 


Ж то, ao 和 mo 是 ra 和 nm 的 原 值 , Fi AS AE SX, (recursion invariant) 在 每 次 
递归 调用 时 都 成 立 : ra" = rog. 这 个 版 本 还 有 另 一 优点 , ERRAR, 还 能 
计算 乘 以 一 个 系数 的 守 . 它 也 处 理 了 指数 为 0 的 情况 . 但 是 在 指数 从 1 变 到 0 
时 power accumulate.0 将 多 做 一 次 平方 . 增加 一 种 情况 就 可 以 消除 它 ; 
template<typename I, typename Op> 

requires(Integer(I) && BinaryOperation(0p)) 


Domain(Op) power_accumulate_i(Domain(Op) r, Domain(Op) a, I n, 


Op op) 

{ 

// B & fF: associative(op) An > 0 

if (п == 1(0)) return т; 

if (п == I(1)) return op(r, a); 

if (n 7 1(2) != 1(0)) r = ор(г, а); 

return power.accumulate i(r, op(a, a), n / I(2), op); 
3 


增加 额外 情况 导致 重复 出 现 的 子 表达 式 , 也 使 三 个 检测 不 独立 了 . 通过 仔 
细 分 析 检测 之 间 的 依赖 性 和 顺序 , 考虑 它们 的 出 现 频率 , 可 以 给 出 


template<typename I, typename Op> 
requires(Integer(I) && BinaryOperation(Op)) 
Оошаіп (0р) power.accumulate 2(Domain(Op) r, Domain(Op) a, I n, 


Op op) 


// ATÆ fF: associative(op) An > 0 
if (n 4 I(2) != I(0) 4 

г = ор(г, a); 

if (п == I(1)) return т; 


} else if (п == I(0)) return r; 
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return power.accumulate 2(r, op(a, a), n / I(2), op); 


在 一 个 尾 递归 过 程 里 , 如 果 所 有 递归 调用 中 的 过 程 形 参 都 是 对 应 的 实 参 ， 
它 就 是 一 个 严格 尾 递归 的 (strict tail-recursive) 过 程 : 


template<typename I, typename Op> 
requires(Integer(I) && BinaryOperation(0p)) 
Domain(Op) power_accumulate_3(Domain(Op) r, Domain(Op) a, I n, 


Ор op) 


// WE: associative(op) An > 0 
if (n 4 102) != 100)) í 

г = op(r, a); 

if (п == 1(1)) return т; 
} else if (п == I(0)) return r; 
a = op(a, а); 
n=n/ 1(2); 


return power accumulate 3(г, a, n, op); 


严格 尾 递 归 过 程 可 以 变换 为 一 个 迭代 过 程 , 方法 是 把 每 个 递归 调用 代 换 为 
一 个 到 过 程 开 始 的 goto, 也 可 以 用 一 个 等 价 的 迭代 结构 : 


template<typename I, typename Op> 
requires(Integer(I) && Вілагу0регабіоп(0р)) 
Domain(Op) power.accumulate 4(Domain(Üp) r, Domain(Op) a, I n, 


Op op) 


// 前 条 件 : associative(op) An > 0 
while (true) { 
if (n 4 I(2) != I(0) 4 
г = op(r, а); 


if (п == 1(1)) return г; 
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} else if (n == I(0)) return r; 
a = op(a, a); 


n=n/ 1(2); 


} 


递归 不 变 式 变 成 了 这 里 的 循环 不 变 式 (loop invariant). 
如 果 开 始 时 n > 0, 在 变 成 0 前 要 先 经 过 1. 我 们 借用 这 种 情况 消去 对 0 的 
检查 并 加 强 前 条 件 (strengthening precondition): 


template<typename I, typename Op> 
requires(Integer(I) && BinaryOperation(Op)) 
Domain(Op) power.accumulate positive O(Domain(Op) r, 
Domain(Op) a, I n, 
Op op) 


// 前 条 件 : associative(op) An > 0 
while (true) { 
if (n % IQ) != 1(0)) í 
г = ор(г, a); 
if (n == I(1)) return т; 
У 
а = ор(а, а); 
n= n / 1(2); 


知道 了 nm > 0 会 很 有 用 . 在 开发 组 件 的 过 程 中 经 常会 发 现 新 的 接口 情况 . 
现在 放松 前 条 件 (relaxing precondition): 


template<typename I, typename Op> 
requires(Integer(I) && BinaryÜperation(0p)) 
Domain(Op) power.accumulate 5(Domain(O0p) r, Domain(Op) a, I n, 


Op op) 
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// 前 条 件 : associative(op) An > 0 
if (п == 1(0)) return r; 


return power accumulate positive O(r, a, n, op); 


通过 一 个 简单 的 等 式 , BEAT UL power accumulate 实现 power: 


这 一 变换 就 是 消去 累积 变量 (accumulation-variable elimination): 


template<typename I, typename Op> 
requires(Integer(I) && BinaryOperation(0p)) 
Domain(Op) power_2(Domain(Op) a, I n, Op op) 
1 
// 前 条 件 : associative(op) An > 0 
return power.accumulate.5(a, a, n - I(1), op); 


39 


这 个 算法 多 做 了 一 些 不 必要 的 运算 . 例如 , 当 m Ж 16 时 它 要 执行 7 次 运算 ， 
其 中 只 有 4 次 是 必要 的 . 当 n 是 奇数 时 这 个 算法 很 好 . 避免 上 述 问题 的 方法 是 


反复 做 a 的 平方 , 并 不 断 将 指数 折 半 直至 它 变 成 奇数 : 


template<typename I, typename Op> 
requires(Integer(I) && BinaryÜperation(0p)) 
Domain(Op) power.3(Domain(O0p) a, I n, Op op) 
{ 
// B # fF: associative(op) An > 0 
while (n % 1(2) == 1(0)) í 
a = op(a, a); 
n = n / I(2); 


n =n / 1(2); 
if (n == 1(0)) return a; 
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return power_accumulate_positive_O(a, op(a, a), n, op); 


} 


练习 3.1 请 自己 确认 最 后 三 行 代码 是 正确 的 . 


3.4 处 理 特 殊 情 况 的 过 程 
在 上 面 的 最 后 版 本 里 用 到 下 面 运算 


/ 10) 
Ж 1(2) == 1(0) 
% (2) != 100) 
== 1(0) 
== (1) 


С К ss 


其 中 / 和 % 的 代价 很 高 . 对 无 符号 整数 或 有 符号 整数 的 非 负 值 , 可 以 用 移 位 和 
掩 码 运算 来 代替 它们 . 

识别 出 程序 里 经 常 出 现 的 表达 式 , 其 中 涉及 一 些 过 程 或 某 种 类 型 的 常量 . 
将 它们 定义 为 相应 的 特殊 情况 过 程 常常 很 有 价值 . 针对 特殊 情况 的 实现 经 常 
比 一 般 情况 的 处 理 更 高 效 , 因此 应 该 把 这 类 过 程 放 入 类 型 的 计算 基 . 对 语言 的 
内 部 类 型 , 通常 存在 针对 特殊 情况 的 机 器 指令 . 对 用 户 定义 类 型 , 针对 特殊 情 
况 的 优化 也 常 有 显著 效果 . 举例 说 , 两 个 任意 多 项 式 的 除法 比 一 个 多 项 式 除 以 
x 难得 多 . 与 此 类 似 , 两 个 高 斯 整数 (形式 为 + bi 的 数 , 其 中 a 和 b 都 是 整数 
Ti i= /—1) 相 除 比 一 个 高 斯 整数 除 以 1 +i 难得 多 . 

任何 整数 类 型 都 应 该 提供 下 面 的 特殊 情况 过 程 : 


Integer(1) 全 
successor : I — I 
nent+l 
人 predecessor : 1 — I 
nen-l 
A twice: I— I 


nen+n 
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A half_nonnegative : I — I 
no [n/2), &'Hn20 
A binary.scale down.nonnegative : I x 1 — I 
(n,k) њ [n/2*], 其 中 mk>0 
人 binary.scale. up.nonnegative : I x I — I 
(n,k) = 2*n, 其 中 mk>0 
人 positive : I — bool 
nn>0 
A negative : I — bool 
non<0 
^ zero : I — bool 
nen=0 
^ one: I — bool 
nen=l1 
A even: I — bool 
n= (n mod 2) = 0 
^ odd : I — bool 
т (n mod 2) #0 


练习 3.2 请 为 C++ 的 各 整数 类 型 实现 上 面 这 些 过 程 . 
现在 可 以 给 出 求 矫 过 程 的 最 后 实现 了 , 其 中 用 到 一 些 特殊 情况 过 程 : 


template<typename I, typename Op> 
requires(Integer(I) && BinaryOperation(Op)) 
Domain(Op) power accumulate positive(Domain(Op) r, 
Domain(Op) a, I n, 
Op op) 


// 前 条 件 : associative(op) A positive(n) 
while (true) { 
if (odd(n)) { 


г = ор(г, а); 
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if (one(n)) return т; 
} 
a = op(a, a); 


n = half nonnegative(n); 


template<typename I, typename Op» 
requires(Integer(I) && BinaryOperation(Op)) 


Domain(Op) power accumulate(Domain(Op) r, Domain(Op) a, I n, 


Op op) 
t 
// 前 条 件 : associative(op) A —negative(n) 
if (zero(n)) return r; 
return power_accumulate-positive(r, a, n, op); 
T 


template<typename I, typename Op» 
requires(Integer(I) && BinaryÜperation(0p)) 
Domain(Op) power(Domain(O0p) a, I n, Op ор) 
< 
// 前 条 伴 : associative(op) Л positive(n) 
while (even(n)) { 
a = op(a, a); 
п = half nonnegative(n); 
Y 
n = half nonnegative(n); 
if (zero(n)) return a; 


return power accumulate positive(a, op(a, a), n, op); 


由 于 已 知 ant" = anam, RER a? 必须 求 出 运算 op 的 单位 元 . 可 以 把 单 
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位 元 作为 操作 的 另 一 参数 传 入 , 将 power 的 定义 扩充 到 包括 0 CES 


template<typename I, typename Op> 

requires(Integer(I) && BinaryOperation(0p)) 
Domain(Op) power(Domain(Op) a, I n, Op op, Domain(Op) id) 
{ 

// 前 条 件 : associative(op) A —negative(n) 

if (zero(n)) return id; 

return power(a, n, op); 


$ 


WA 3.1 浮 点 乘法 和 加 法 不 可 结合 , 用 于 作为 power 或 power left associated 的 
运算 就 可 能 得 到 不 同 结果 . 请 设法 弄 清 , 在 求 浮 点 数 的 整数 次 寡 时 , 是 power 还 
是 power left associated 能 给 出 更 准确 的 结果 . 


3.5 参数 化 算法 
power 在 为 算法 提供 运算 时 采用 了 两 种 不 同 技术 : 


1, 可 结合 运算 通过 参数 传递 . 这 使 power 可 以 用 于 同一 类 型 的 不 同 运算 , 例 
如 用 于 模 m BJ 3832. 


2. 指数 上 的 运算 被 作为 指数 类 型 的 计算 基 的 一 部 分 . 例如 , 这 里 采用 为 
power 传 一 个 half nonnegative 参数 的 方式 , 是 因为 不 知道 是 否 存 在 某 种 情 
况 , 其 中 需要 在 同一 类 型 上 为 half nonnegative 提供 另 一 种 实现 方式 . 


一 般 而 言 , 当 一 个 算法 可 以 用 于 同样 类 型 的 不 同 运算 时 , 就 应 该 考虑 通过 参数 
传递 运算 . 当 过 程 以 一 个 运算 为 参数 时 , 如 果 可 能 就 应 该 提供 一 个 合适 的 默认 
运算 . 例如 , 传 给 power 的 最 自然 的 默认 运算 是 乘法 . 

一 个 运算 符 或 过 程 名 表示 了 不 同类 型 里 语义 相同 的 多 个 运算 的 情况 称 为 
重 载 (overloading), 此 时 也 说 该 运算 符 或 过 程 名 是 在 类 型 上 重 载 的 . 典型 的 例 
子 是 +, ЕЛТАМ. па. аяар. 数学 里 总 用 + 表示 可 结 


6. 另 一 技术 是 定义 一 个 函数 identity element, 使 identity element(op) 返回 op 的 单位 元 . 
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合并 可 交换 的 运算 , 因此 用 + 表示 字符 串 拼 接 就 有 些 不 合理 , 与 此 类 似 , WR 
同时 有 + 和 x, x 必须 在 + 上 分 配 . power 里 的 half_nonnegative 也 是 在 指数 类 
型 上 重 载 的 . 

实例 化 一 个 抽象 过 程 , 例如 实例 化 collision-point 或 者 power, 建立 的 是 一 些 
重 载 过 程 . 如 果实 际 的 类 型 参数 满足 需求 , 同一 抽象 过 程 的 多 个 实例 将 具有 相 
同 的 语义 . 


3.6 ”线性 递归 
k 阶 的 线性 递归 函数 (linear recurrence function) 是 一 个 函数 f, WEA 


kl 
fluo Y) = У ам 
i=0 
其 中 系数 aoar Z 0. 序列 fxo,xa,…'} 是 一 个 k 阶 的 线性 递归 序列 , 如 果 存 在 
一 个 k 阶 线性 递归 函数 , 例如 t, 使 得 


(Vn 2 к) xn = f(Xn—15 -+ -3 Ха) 


请 注意 , 这 里 的 下 标 x 是 递减 的 . 给 定 了 k пЗ хо... 和 一 个 k 阶 的 
线性 递归 函数 , 我 们 可 以 通过 一 个 明显 的 算法 生成 一 个 线性 递归 序列 . 对 所 有 
n 2 k 计算 xy, 该 算法 要 求 应 用 函数 n 一 k 十 1 次 . 下 面 将 看 到 , 利用 power, 只 需 
Ollogs n) 步 就 可 以 算出 x.” 如 果 fluo... uui) = 工 :0 ay 是 一 个 k 阶 线性 
递归 函数 , 可 以 认为 了 是 执行 了 一 个 向 量 内 积 运算 :8 


уо 


IMPR 


Uk 一 1 


如 果 把 系数 向 量 扩充 为 从 对 角 线 为 1 的 伴随 矩阵 (companion matrix), 就 
可 以 在 计算 x, 的 新 值 的 同时 将 相应 的 老 值 x。1,…,xn_x+1 移 到 下 次 迭代 所 





7. 线 性 递归 的 第 一 个 O(logn) 算法 应 归功 于 Miller and Brown [1966]. 
8. 按 线性 代数 的 观点 , 见 Kwak and Hong [2004]. 有 关 线性 递归 的 讨论 从 214 页 开始 - 
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需 的 正确 位 置 : 

ao а G2 …' 4-2 4-1 Xn 一 1 Xn 

1 0 O … 0 0 Жей Xii 

O 1 0 es 0 0 xn-3| = | xn-2 

Ú O Ü == 1 0 Xin’ Жары 


由 于 矩阵 乘法 具有 可 结合 性 , 易 知 , 将 k 个 初始 值 的 向 量 乘 以 该 伴随 矩阵 
的 n 一 k 十 1 XR, 就 能 得 到 x,: 


nm 一 k 十 1 
Xn ao Qj a2 `’ ak-2 а-1 хк—1 
xn_1 100. 0 0 хк—2 
x-2|2|]0 1 0-- 0 0 хуз 
Snit ооо …: 1 0 xo 


利用 power, 通过 至 多 2logz(n — k + 1) 次 矩阵 乘法 就 可 以 得 到 x 而 直截了当 
的 矩阵 乘法 需要 做 k3 次 系数 乘法 和 k3 — 2 次 系数 加 法 . 这 样 , x, 的 计算 需要 
做 不 多 于 2kŠ log,(n —k+ 1) 次 系数 乘法 和 2(k3 — к?) logo(n — k - 1) 次 系数 加 法 . 
应 记得 , k 是 线性 递归 的 阶 , 而 且 是 一 个 常数 .9 

这 里 没有 定义 线性 递归 序列 的 元 素 类 型 . 它 可 以 是 整数 、 有 理 数 、 实数 
或 复数 . 只 要 求 它 存在 可 结合 并 可 交换 的 加 法 和 乘法 , 而 且 乘法 对 加 法 分 配 .2 

由 2 阶 线性 递归 函数 

fib(yo,y1) = vo + v 

从 初始 值 f = 0 ЖП fy = 1 ОА f, 称 为 斐 波 那 契 序列 .2 用 power 8 2 x 2 
矩阵 乘法 可 以 直接 计算 第 n 个 斐 波 那 契 数 f,. FEH SE BA ЗЕ ЛЕ УП И AR A, 
对 这 一 特殊 实例 , 说 明 其 中 的 к 次 乘法 能 如 何 减 少 . > 


* 1 
F= 
10 


9. Fiduccia [1985] 说 明了 可 以 怎样 通过 模 多 项 式 乘法 减 小 这 里 的 常数 因子 . 
10. 这 就 是 说 , 允许 任何 是 半 群 的 模型 的 类 型 . 半 群 概念 将 在 第 5 章 定义 . 
11. Leonardo Pisano, Liber Abaci, 第 一 版 , 1202. 英 译本 见 Sigler [2002]. 该 序列 在 404 页 . 
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为 通过 线性 递归 生成 斐 波 那 契 序 列 的 伴随 矩阵 . 可 以 证 明 


确实 如 此 : 


|1 1| јн fr 
1 0 Te Trad 

[feat fatfn-i| ә fata 
fata f. fa fs 


这 使 我 们 可 以 把 F" 和 F 的 矩阵 乘积 写成 


к“ 一 fa fm fa fs 
fm fm—1 fa fai 


_ |fmttfntitfmfn fmtifn + fmfn—a 
fmfn+1 fucifs fmfn + аға 


矩阵 F" 可 以 基于 其 最 下 一 行 表示 为 一 个 pair (fafai), 因为 顶 行 可 以 用 
(fci + fr fr) 计算 . 这 样 就 得 到 了 下 面 代 码 : 


template<typename I> 
requires(Integer(1)) 
pair<I, I> fibonacci matrix multiply(const pair<I, I>& x, 


const pair<I, I»& y) 


return pair<I, I>( 
x.mO * (у.ш1 + y.mO) + x.mi * y.m0, 


x.mO * y.mO + x.mi ж у.ші); 
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这 一 过 程 只 需 执行 4 次 乘法 , 而 不 像 一 般 的 2 x 2 矩阵 乘法 那样 要 做 8 次 . 
由 于 F" 底 行 的 第 一 个 元 素 是 fn 下 面 过 程 能 算出 fa: 
template<typename I> 

requires (Integer (I)) 


I fibonacci(I n) 


{ 
(0 // WH n >o 
if (п == 1(0)) return 1(0); 
return power(pair<I, I»(I(1), 100)), 
n, 
fibonacci_matrix_multiply<I>) .m0; 
y 
3.7. 累积 过 程 


前 一 章 将 动作 定义 为 变换 的 一 个 对 偶 . 如 果 以 下 面 语句 的 形式 应 用 二 元 运算 ， 
,每 个 二 元 运算 也 存在 一 个 对 偶 过 程 
x = ор(х; у); 


通过 和 另 一 对 象 结合 的 方式 把 一 个 对 象 送 给 二 元 运算 , 用 以 修改 其 状态 ， 
就 定义 了 在 该 对 象 上 的 一 个 累积 过 程 (accumulation procedure), 可 以 基于 二 元 
运算 定义 这 种 累积 过 程 , 反之 亦 然 : 


void op-accumulate(T& x, const T& y) { x = op(x, y); } 
// 从 二 元 运算 定义 累积 过 程 

还 有 

T op(T x, const T& y) { op-accumulate(x, y); return x; } 
// 从 累积 过 程 定义 二 元 运算 


与 动作 的 情况 类 似 , 有 时 独立 的 实现 更 加 高 效 , 在 这 种 情况 下 需要 同时 提 
供 二 元 运算 和 累积 过 程 . 


练习 3.3 请 基于 累积 过 程 重 写本 章 的 算法 . 
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ІЙ Н 3.2 请 基于 Miller and Brown [1966] 和 Fiduccia [1985] 的 结果 构造 一 个 用 
于 生成 线性 递归 序列 的 库 . 


3.8 总 结 


如 果 一 个 算法 可 以 应 用 于 满足 某 些 需求 条 件 (例如 可 结合 性 ) 的 不 同 模型 , 它 
就 是 抽象 的 . 代码 优化 也 基于 等 式 推理 . 除非 已 知 有 关 的 类 型 是 规范 的 , 否则 
可 以 做 的 优化 就 非常 少 . 处 理 特殊 情况 的 过 程 可 能 使 代码 更 为 高 效 甚 至 更 抽 
象 . 数学 和 抽象 算法 的 结合 可 能 导出 令 人 惊异 的 算法 , 例如 在 对 数 时 间 里 生成 
线性 递归 序列 里 的 第 n 个 元 素 . 
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y Te (例如 传递 性 和 对 称 性 ), 并 将 着 重 介绍 全 序 和 
弱 线 性 序 . 这 里 要 引进 基于 线性 序 的 函数 的 稳定 性 的 概念 , 稳定 性 保证 维持 作 
为 参数 的 等 价 元 素 的 序 关系 . 我 们 还 要 把 min 和 max 推广 到 序 选 择 函数 , 例如 
三 个 元 素 的 中 间 值 元 素 . 这 里 还 要 介绍 一 种 技术 , 它 可 以 通过 将 问题 归 约 到 受 
限 子 问题 的 方式 处 理 其 实现 的 复杂 性 . 


4.1 关系 的 分 类 
关系 (relation) 是 有 两 个 同类 型 参数 的 谓词 : 


Relation(Op) 全 
HomogeneousPredicate(Op) 
A Arity(Op) =2 


一 个 关系 是 传递 的 (transitive), MRE а Alb MILAN b Alc MIL, MA 
就 一 定 对 а Al c 成 立 : 
property(R : Relation) 
transitive : К 
т > (Va, b, c € Domain(R)) (r(a, b) /\т(Ъ,с) = r(a,c)) 
传递 关系 的 例子 如 相等 、 二 元 组 的 第 一 个 元 素 相等 、 轨 道上 的 可 达 性 、 
整除 关系 等 . 


一 个 关系 是 严格 的 (strict), 如 果 它 绝 不 在 任 一 个 元 素 与 其 自身 之 间 成 立 ; 
一 个 关系 是 自 反 的 (reflexive), 如 果 每 个 元 素 与 其 自身 之 间 总 有 这 一 关系 : 
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property(R : Relation) 
strict : К 
T > (Va € Domain(R)) —r[a, а) 
property(R : Relation) 
reflexive : R 
r (Va € Domain(R)) r(a, a) 
前 面 作为 例子 的 关系 都 是 自 反 的 , 真 因子 关系 是 严格 的 . 
练习 4.1 请 给 出 一 个 关系 的 例子 , 它 既 不 严格 也 不 自 反 . 
一 个 关系 是 对 称 的 , 如 果 任 何 时 候 它 在 一 个 方向 上 成 立 , 也 必然 在 另 一 方 
向 上 成 立 . 一 个 关系 是 反对 称 的 , 如 果 它 绝 不 会 在 两 个 方向 上 都 成 立 : 
property(R : Relation) 
symmetric : R 
T > (Va,b € Domain(R)) (r(a, b) => r(b, a)) 
property(R : Relation) 
asymmetric : R 
r> (Va, b € Domain(R)) (r(a, b) = —т(Ъ, a)) 
对 称 关 系 的 一 个 例子 是 “兄弟 姐妹 "; ККЖ И — p| f Re MEE. 
练习 4.2 请 给 出 一 个 关系 的 例子 , 它 是 对 称 的 但 不 传递 . 
练习 4.3 请 给 出 一 个 关系 的 例子 , 它 是 对 称 的 但 不 自 反 . 
对 给 定 的 关系 rab), 存在 一 些 具有 相同 作用 域 的 派生 关系 (derived 


relation): 


complement,(a,b) <> -—r(a,b) 
converse,(a,b) <> r(b,a) 
complement_of_converse,(a,b) <> -—r(b,a) 
对 于 对 称 关系 而 言 , 有 意思 的 派生 关系 只 有 它 的 补 (complement), AA È 
的 逆 (converse) 关系 就 等 于 它 自身 . 
一 个 关系 是 一 个 等 价 关 系 , 如 果 它 同时 是 传递 的 、 自 反 的 和 对 称 的 : 
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property(R : Relation) 
equivalence : R 


r > transitive(r) A reflexive(r) A symmetric(r) 
等 价 关 系 的 例子 包括 相等 、 几 何 全 等 、 整 数 的 模 n 相等 . 
引 理 4.1 MR r 是 等 价 关 系 , ЖА a = b = r(a,b). 


一 个 等 价 关系 把 它 的 定义 域 划分 为 一 集 等 价 类 (equivalence class), 即 划分 
为 一 些 子 集 , 每 个 子 集 包含 所 有 等 价 于 某 给 定 元 素 的 所 有 元 素 . 我 们 通常 可 以 
通过 定义 一 个 关键 码 函数 (key function) 的 方式 来 实现 一 个 等 价 关 系 . 这 一 关 
键 码 函数 对 每 个 等 价 类 里 的 所 有 元 素 返 回 一 个 唯一 值 . 将 相等 判断 应 用 于 关 
键 码 函数 的 结果 , 就 能 确定 两 个 元 素 是 否 等 价 : 

property(F : UnaryFunction, R : Relation) 
requires(Domain(F) — Domain(R)) 

key function : F x R 
(f,r) њ (Va, b € Domain(F)) (r(a, b) = f(a) = f(b)) 


引 理 4.2 key function(f, r) = equivalence(r) 


42 SF FHF 


一 个 关系 是 一 个 全 序 (total order), 如 果 它 是 传递 的 , 而 且 满 足 三 分 律 (tri- 
chotomy law), 也 就 是 说 , 对 任 一 对 元 素 , 下 面 三 者 中 恰 有 一 个 成 立 : 该 关系 , 该 
关系 的 逆 , 或 两 者 相等 : 
property(R : Relation) 
total_ordering : R 
T > transitive(r) A 
(Va, є Domain(R)) 下 面 三 者 中 恰 有 一 个 成 立 : 
r(a,b),r(b,a), R a=b 
—+*KARE—* š Ж (weak ordering), 如 果 它 是 传递 的 , 而 且 在 原 定义 域 上 


存在 一 个 等 价 关 系 , 使 原 关 系 满足 弱 三 分 律 (weak trichotomy law), BI, 对 任 一 
对 元 素 下 面 三 者 中 恰 有 一 个 成 立 : BRA, 该 关系 的 逆 , 或 者 上 述 等 价 关系 : 
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property(R : Relation, E : Relation) requires(Domain(R) = Domain(E)) 
weak. ordering : R 
++ transitive(r) A (Зе € E)equivalence(e) A 
(Va, b € Domain(R)) 下 面 三 者 中 恰 有 一 个 成 立 : 
т(а, b), r(b, a), BË e(a, b) 


给 定 关 系 r, 关系 —r(a,b)A—r(b, a) Ж 28 r Ë) st ЖЕ 3F (symmetric complement). 
引 理 4.3 弱 序 的 对 称 补 是 一 个 等 价 关系 . 

弱 序 的 例子 如 基于 其 第 一 个 元 排序 的 二 元 组 , 或 基于 工资 排序 的 雇员 . 
引 理 4.4 全 序 是 弱 序 . 
引 理 4.5 弱 序 是 反对 称 的 . 
引 理 4.6 弱 序 是 严格 的 . 

集合 T 上 的 一 个 关键 元 函数 f 加 上 上 f 的 值 域 上 的 一 个 全 序 " EX Y T E 


的 一 个 弱 序 (х,у)  r(f(x), f(y). 
下 面 把 全 序 和 弱 序 统称 为 线性 序 (linear ordering), 因为 它们 都 遵从 三 分 律 . 
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给 定 弱 序 * 和 取 自 r 的 作用 域 的 两 个 元 素 ЖП b, 问 两 者 中 哪个 更 小 就 有 意义 . 
当 T 或 其 逆 对 a 和 bb 成 立时 , 很 容易 定义 两 者 中 的 较 小 元 ; 但 如 果 两 者 等 价 , 事 
情 就 不 好 处 理 了 . 考虑 哪个 元 素 较 大 时 也 会 遇 到 类 似 问题 . 

处 理 这 个 问题 的 一 个 重要 性 质 称 为 稳定 性 (stability). 非 形式 地 说 , 一 个 
算法 是 稳定 的 , 如 果 它 不 会 破坏 等 价 元 素 原 来 的 顺序 . 因此 , 如 果 将 取 较 小 
(minimum) 或 较 大 (maximum) 看 作 从 一 个 包含 两 个 参数 的 表 中 选取 较 小 或 者 
较 大 元 素 , 在 对 两 个 等 价 的 元 素 调用 选取 较 小 元 操作 时 , 稳定 性 要 求 必须 返回 
第 一 个 参数 ; 而 取 较 大 元 的 操作 则 应 返回 第 二 个 元 素 . 

可 以 把 选取 较 小 元 和 较 大 元 推广 到 (j,k)- 序 选取 , 这 里 的 k > 0 表示 参数 的 
个 数 , 而 0 < j <k 表示 要 求 选取 第 j 个 最 小 的 元 素 . 为 了 形式 化 稳定 性 的 概念 ， 

















1. 后 面 几 章 将 把 稳定 性 的 概念 扩展 到 其 他 算法 类 . 
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假定 k 个 参数 中 的 每 个 都 关联 着 一 个 唯一 自然 数 , 称 为 其 稳定 性 索引 (stability 
index). 给 定 了 原始 的 弱 序 r 后 , 我 们 将 (AR, 稳定 性 索引 ) 对 偶 上 的 增强 关系 
(strengthened relation) + 定义 为 : 


#((a, ia), (b, is) & (a,b) V (7r(b a) Aia < in) 


如 果 基 于 实现 按 序 选取 算法 , 即使 对 等 价 元 素 , 这 里 也 没有 了 歧义 性 . 一 个 参 
数 的 默认 稳定 性 索引 就 是 它 在 参数 表 里 的 位 置 . 

增强 关系 + 也 是 对 稳定 性 进行 推理 的 强大 工具 . 实际 上 , 很 容易 定义 一 个 
简单 的 按 序 选取 过 程 , 而 不 显 式 表示 稳定 性 索引 . 下 面 的 选 较 小 元 实现 在 a 和 
b 等 价 时 返回 a, 它 满 足 有 关 稳 定性 的 定义 :2 


template<typename R> 
requires(Relation(R)) 
const Domain(R)& select 0 2(const Domain(R)& a, 


const Domain(R)& b, R r) 


// BI # fF: weak-ordering(r) 
if (r(b, a)) return b; 


return a; 


类 似 的 , 下 面 的 选 较 大 元 实现 在 a 和 ob 等 价 时 返回 b, 满足 前 面 有 关 稳 定 
性 的 定义 :3 


template<typename R> 
requires(Relation(R)) 
const Domain(R)& select 1 2(const Domain(R)& a, 


const Domain(R)& b, R r) 


// BI & fF: weak ordering(r) 


if (r(b, a)) return a; 





2. 有 关 命 名 方面 的 约定 在 本 节 后 面 解释 - 
3.STL 不 正确 地 要 求 max(a, b) 在 a 和 等 价 时 返回 a. 
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return b; 


本 章 剩 下 部 分 的 讨论 中 总 假定 有 前 条 件 weak_ordering(r). 

虽然 对 任意 k 个 参数 的 按 序 选取 过 程 都 可 能 有 用 , 但 是 随 着 k 值 的 增长 ， 
写 出 这 样 的 按 序 选取 函数 也 会 很 快 变 得 越 来 越 困 难 , 而 且 会 有 太 多 的 过 程 可 能 
一 次 也 不 会 被 人 使 用 . 有 一 种 称 为 归 约 到 受 限 子 问题 (reduction to constrained 
subproblem) 的 技术 可 以 很 好 地 处 理 这 两 个 问题 . 下 面 要 开发 一 族 过 程 , 其 中 假 
定 了 一 些 与 参数 的 相对 序 有 关 的 信息 . 

这 里 为 过 程 进行 系统 化 命名 的 问题 至 关 重要 . 每 个 名 字 都 以 select jk Ж 
Ж, HPO <j « k, 表明 是 从 k 个 参数 中 选取 第 j 个 大 的 元 素 . 这 里 还 要 附加 一 
系列 字母 来 表示 有 关 参 数 序 的 前 条 件 . 例如 , 后 级 ab 意味 着 前 两 个 参数 有 序 ， 
而 -abd 意味 着 第 1, 2 和 4 个 元 素 有 序 . 如 果 对 不 同 的 参数 链 都 有 前 条 件 , 就 用 
多 个 这 样 的 后 级 . 

看 儿 个 例子 . 取 三 个 元 素 中 的 最 小 元 和 最 大 元 很 容易 实现 : 


template<typename R> 
requires (Relation(R)) 
const Domain(R)& select 0 3(const Domain(R)& a, 
const Domain(R)& b, 


const Domain(R)& c, R r) 


return select 0 2(select.0 2(a, b, r), c, г); 
} 


template<typename R> 
requires (Relation(R)) 
const Domain(R)& select 2.3(const Domain(R)& a, 
const Domain(R)& b, 


const Domain(R)& c, R r) 


return select 1 2(select 1 2(a, b, r), c, r); 
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如 果 已 知 前 两 个 元 素 是 上 升序 , 很 容易 找 出 三 个 元 素 里 的 中 间 值 元 素 : 


template<typename R> 
requires(Relation(R)) 
const Domain(R)& select 1.3.ab(const Domain(R)& a, 
const Domain(R)& b, 


const Domain(R)& c, R r) 


if (!r(c, b)) return b; // а, b, c 是 按 硕 序 排列 的 
return select.12(a, c, r); // b 不 是 中 间 值 元 素 


建立 select 1.3.ab 的 前 条 件 只 需 做 一 次 比较 . 因为 参数 通过 常量 引用 传递 ， 
而 这 里 并 不 移动 数据 : 
template<typename R> 
requires(Relation(R)) 
const Domain(R)& select.1.3(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, R r) 


if (r(b, a)) return select 1 3 ab(b, a, c, r); 


return select.13 ab(a, b, c, r); 


在 最 坏 情 况 下 select. 1.3 要 做 3 次 比较 . ШЖ c 是 a, b,c 中 的 最 大 元 素 , 函 
数 就 只 需 做 两 次 比较 . 由 于 发 生 后 一 情况 有 三 分 之 一 的 可 能 性 , 因此 平均 比较 
次 数 是 22. 这 里 假定 各 种 输入 情况 平均 分 布 . 

An 个 元 素 里 找 出 第 二 小 的 元 素 至 少 需 要 做 n+ [logon] 一 2 次 比较 .4 特 
别 的 , 从 4 个 元 素 中 找 出 第 二 小 的 元 素 需 要 做 4 次 比较 . 

如 果 知 道 参数 中 第 一 对 元 素 和 第 二 对 元 素 都 分 别 为 上 升 排序 的 , 那么 就 很 
容易 从 中 选 出 第 二 小 的 元 素 : 


4. 这 一 结论 是 Jozef Schreier 提出 的 猜想 , 后 来 被 Sergei Kislitsyn 证 明 [Knuth 1998, 209 ЇЙ, 
Theorem S]. 
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template<typename R> 
requires (Relation(R)) 
const Domain(R)& select 1.4 ab cd(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, Rr) { 
if (r(c, a)) return select 0 2(a, d, r); 


return Select.0.2(b, c, г); 


如 果 已 知 第 一 对 参数 按 上 升序 排列 , 再 做 一 次 比较 就 可 以 建立 起 
select.1.4.ab.cd 的 前 条 件 : 


template<typename R> 
requires(Relation(R)) 
const Domain(R)& select 1 4 ab(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, Rr) { 
if (r(d, c)) return select.1.4 ab cd(a, b, d, c, r); 


return Select 14 ab.cd(a, b, c, d, r); 


做 一 次 比较 就 可 以 建立 select 1.4 ab 的 前 条 件 : 


template<typename R> 
requires(Relation(R)) 
const Domain(R)& select 1 4(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, Rr) { 
if (r(b, a)) return select.1.4 ab(b, a, c, d, r); 


return select 1.4 ab(a, b, c, d, r); 
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练习 4.4 请 实现 select 2 4. 


维持 直至 4 阶 的 按 序 选取 网 络 的 稳定 性 不 太 困难 . 但 到 5 阶 就 出 现 了 新 情 
况 , 其 中 对 应 于 一 个 受 限 子 问题 的 过 程 被 原 调用 方 以 不 合 顺序 的 参数 调用 了 ， 
这 就 违背 了 稳定 性 . 处 理 这 种 情况 的 系统 化 方法 是 把 稳定 性 索引 和 各 实 参 一 
起 传递 , 并 使 用 强化 关系 +. 下 面 利用 整数 模板 参数 来 避免 额外 的 运行 时 开销 . 

将 对 应 于 参数 a, b 等 的 稳定 性 索引 命名 为 ia, іь,.... 利用 函数 对 象 模板 
сотраге ѕїгісі ог. геПехіме 得 到 增强 的 关系 1, 这 个 函数 对 象 模板 有 一 个 类 型 为 
bool 的 模板 参数 . 该 参数 为 真 时 , 意味 着 其 参数 的 稳定 性 索引 是 按 上 升序 排列 
的 : 


template<bool strict, typename R> 
requires(Relation(R)) 


struct compare strict or reflexive; 


在 构造 compare strict -or_reflexive 的 实例 时 , 送 给 它 了 一 个 适当 的 布尔 类 型 
的 模板 实 参 : 


template<int ia, int ib, typename R> 
requires(Relation(R)) 
const Domain(R)& select.0 2(const Domain(R)& a, 
const Domain(R)& b, R r) 


1 
compare strict.or.reflexive«(ia < ib), R> cmp; 
if (cmp(b, a, r)) return b; 
return a; 

} 


下 面 要 针对 两 种 情况 做 出 compare. strict.or reflexive 的 : (1) 按 上 升序 排列 的 
稳定 性 索引 , 在 这 种 情况 下 用 原来 的 严格 关系 v; (2) 按 下 降序 排列 的 稳定 性 索 
引 , 这 种 情况 下 用 关系 + 对 应 的 自 反 版 本 : 


template<typename R> 
requires(Relation(R)) 


struct compare.strict or reflexive«true, R> // 严格 的 
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bool operator() (const Domain(R)& a, 
const Domain(R)& b, R r) 


return r(a, b); 


2; 


template<typename R> 

requires(Relation(R)) 
struct compare strict or reflexive«false, R> // H&M 
t 

bool operator()(const Domain(R)& a, 


const Domain(R)& b, R r) 
return !r(b, a); // complement of. converse, (a, b) 


) 


当 一 个 带 有 稳定 性 索引 的 序 选择 过 程 调 用 另 一 这 类 过 程 时 , 稳定 性 索引 要 
与 参数 对 应 , 按 参 数 在 调用 中 出 现 的 同样 顺序 传递 它们 : 


template<int ia, int ib, int ic, int id, typename R> 
requires (Relation(R) ) 
const Domain(R)& select 1.4 ab.cd(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, R r) 


compare strict ог ге#1ехіуе<(іа < ic), R> cmp; 
if (cmp(c, a, r)) return 
select 0.2«ia,id»(a, d, г); 


return 
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select_0_2<ib,ic>(b, c, г); 


template<int ia, int ib, int ic, int id, typename R> 
requires(Relation(R)) 
const Domain(R)& select 1.4 ab(const Domain(R)& a, 
const Domain(R)& b, 


const Domain(R)£ c, 


const Domain(R)& d, R г) 


£ 
compare_strict_or_reflexive<(ic < id), А> cmp; 
if (cmp(d, c, r)) return 
select-1-4_ab-cd<ia,ib,id,ic>(a, b, d, c, r); 
return 
select_1_4.ab_cd<ia,ib,ic,id>(a, b, c, d, r); 
} 


template<int ia, int ib, int ic, int id, typename R> 
requires (Relation(R)) 
const Domain(R)& select 1 4(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, R r) 


X 
compare strict or.reflexive«(ia < ib), R> cmp; 
if (cmp(b, a, r)) return 
select_1_4_ab<ib,ia,ic,id>(b, a, c, d, r); 
return 
select 1 4 ab4ia,ib,ic,id»(a, b, c, d, r); 
T 


至 此 我 们 已 经 为 实现 5 选择 做 好 了 准备 : 


59 
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template<int ia, int ib, int ic, int id, int ie, typename R> 
requires (Relation(R)) 
const Domain(R)& select 2 5 ab cd(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, 


const Domain(R)& e, R r) 


t 
compare_strict_or_reflexive<(ia < ic), R> cmp; 
if (cmp(c, a, r)) return 
select-1-4_ab<ia,ib,id,ie>(a, b, d, e, r); 
return 
select_14_ab<ic,id,ib,ie>(c, d, b, e, г); 
} 


template<int ia, int ib, int ic, int id, int ie, typename R> 
requires(Relation(R)) 
const Domain(R)& select-2-5-ab(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, 


const Domain(R)& e, R r) 


{ 
compare_strict_or_reflexive<(ic < id), R> cmp; 
if (cmp(d, c, r)) return 
Select 2.5 ab.cd4ia,ib,id,ic,ie»(a, b, d, c, е, r); 
return 
Select.2.5.ab.cdXia,ib,ic,id,ie»(a, b, c, d, е, r); 
} 


template<int ia, int ib, int ic, int id, int ie, typename R> 


requires (Relation(R) ) 
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const Domain(R)& select 2 5(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, 


const Domain(R)k e, R r) 


Z 
compare_strict_or_reflexive<(ia < ib), R> cmp; 
if (cmp(b, a, r)) return 
select 2 5 ab4ib,ia,ic,id,ie»(b, a, c, d, e, г); 
return 
Select 2 5 abKia,ib,ic,id,ie»(a, b, c, d, e, r); 
Y 


3| E 4.7 select 2.5 执行 6 次 比较 . 


练习 4.5 请 设法 找 出 一 个 算法 , 它 返回 5 个 参数 的 中 间 值 元 素 , 但 做 的 比较 次 
数 比 平均 情况 少 一 点 . 


我 们 可 以 把 按 序 选取 过 程 包装 在 一 个 外 围 过 程 里 , 该 外 围 过 程 可 以 提供 任 
何 严 格 递增 的 整数 常数 序列 作为 稳定 性 索引 . 为 方便 起 见 , 这 里 直接 用 从 0 开 
始 的 顺序 整数 : 


template<typename R> 
requires (Relation(R) ) 
const Domain(R)& median 5(const Domain(R)& a, 
const Domain(R)& b, 
const Domain(R)& c, 
const Domain(R)& d, 


const Domain(R)& e, R r) 


return select 2 5«0,1,2,3,4»(a, b, c, d, е, r); 
} 


练习 4.6 请 证 明 本 节 里 的 每 个 按 序 选取 过 程 的 稳定 性 . 
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练习 4.7 通过 穷尽 测试 验证 本 节 里 每 个 按 序 选取 过 程 的 正确 性 和 稳定 性 . 
项 目 4.1 请 为 保证 按 序 选 取 过 程 的 组 合 的 稳定 性 提出 一 集 充 分 必要 条 件 . 


项 目 4.2 请 为 稳定 的 排序 和 归并 创建 一 个 最 大 最 小 过 程 库 .5 不 仅 使 比较 的 次 
数 达 到 最 小 , 也 使 数据 移动 次 数 达到 最 小 . 


44 自然 全 序 


在 一 个 类 型 里 , 两 个 值 相等 意味 着 它们 表示 同一 实体 , 所 以 , 在 任何 类 型 上 只 有 
唯一 的 一 个 相等 关系 . 但 在 一 个 类 型 上 未 必 只 有 唯一 的 一 个 自然 全 序 . 对 一 个 
具体 类 别 , 经 常 存在 多 个 全 序 和 弱 序 , 它们 中 并 没有 哪个 扮演 特殊 的 角色 . 而 对 
一 个 抽象 类 别 , 却 可 能 有 一 个 符合 其 基本 运算 需要 的 特殊 全 序 . 这 个 序 称 为 它 
的 自然 全 序 (natural total ordering), 用 符号 < 表示 , 描述 如 下 : 


TotallyOrdered(T) 全 
Regular(T) 
A «: Tx T= bool 
A total_ordering(<) 


例如 , 整数 的 自然 全 序 符合 其 基本 运算 的 需要 : 


а < successor(a) 

а < b = successor(a) < successor(b) 
a<b>a+c<bte 
a<bA0<c>ca<cb 


有 些 类 型 并 没有 自然 全 序 . 例如 复数 类 型 和 雇员 记录 都 没有 . RN R E 
意 一 个 规范 类 型 都 提供 一 个 默认 全 序 (default total ordering. 有 时 简称 为 默认 
序 , default ordering), 以 便 能 做 对 数 时 间 的 检索 . 作为 将 非 自 然 全 序 看 作 默 认 序 
的 例子 , 可 以 考虑 复数 上 的 字典 序 . 如 果 存 在 自然 全 序 , 它 就 是 默认 序 . 我 们 采 
用 下 面 的 记 法 : 
| 规程 | C++ 
T 的 默认 序 | less; | less<T> 








5. 参 看 Knuth [1998, 5.3 节 : BRHF]. 
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4.5 派生 过 程 组 


有 些 过 程 很 自然 地 成 组 出 现 , 只 要 定义 了 该 组 中 的 某 个 过 程 , 自然 就 有 了 整个 
组 里 的 其 他 过 程 . 相等 的 补 就 是 不 等 , 只 要 有 相等 它 就 自然 有 了 定义 , 因此 运 
F = 和 头 必 须 协调 地 定义 . 对 每 个 全 序 类 型 , 4 个 运算 符 <, >, < 和 > 必须 
协调 地 定义 , 以 保证 下 面 几 个 关系 成 立 : 


a>beb<a 
a <b < —(b < a) 
a2 b @ —(a < b) 


46 按 序 选取 过 程 的 扩展 


本 章 讨 论 的 按 序 选取 过 程 返 回 的 对 象 是 不 能 变动 的 , 因为 过 程 里 用 的 都 是 常 
量 引 用 . 可 以 定义 另 一 种 过 程 版 本 返回 可 变动 的 对 象 , 使 这 种 对 象 可 以 用 在 赋 
值 的 左边 , 或 者 作为 动作 或 累积 过 程 的 可 变动 参数 , 这 样 的 过 程 版 本 很 有 用 ， 
定义 也 直截了当 . 可 以 用 重 载 的 方式 实现 按 序 选 取 过 程 的 变动 版 本 , 为 此 只 需 
从 非 变动 版 本 中 简单 地 去 掉 每 个 参数 类 型 和 返回 值 类 型 的 const. 看 一 个 例 
T, 前 面 的 select.0.2 的 一 个 新 版 本 是 


template<typename R> 

requires (Relation(R)) 
Domain(R)& select_0_2(Domain(R)& a, Domain(R)& b, R r) 
1 

if (r(b, a)) return b; 


return a; 


进一步 说 , 实现 全 序 类 型 (有 <) 的 库 应 该 提供 这 些 版 本 的 过 程 , 因为 它们 
都 经 常 需要 . 这 意味 着 每 个 过 程 需要 4 个 不 同 版 本 . 

全 序 或 弱 序 满足 三 分 律 或 弱 三 分 律 , 这 提示 我 们 可 以 不 用 二 值 关系 , 而 用 
一 种 三 值 的 比较 过 程 . 在 一 些 情况 下 这 样 做 可 能 避免 一 次 额外 的 过 程 调用 . 


练习 4.8 请 用 三 值 比较 过 程 重 写 本 章 的 各 算法 . 
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4.7 总 结 
全 序 和 弱 序 的 公理 为 联系 特定 的 序 和 通用 算法 提供 了 一 个 接口 . 对 一 些小 问 
题 的 系统 化 的 解 , 可 以 有 利于 简化 大 问题 的 分 解 . 存在 许多 具有 相互 关联 的 语 
义 的 过 程 组 . 
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第 5 章 
有 序 代数 结构 


p—-——— 从 半 群 开始 直至 环 和 模 . 
而 后 用 全 序 的 观点 组 合 这 些 代 数 概念 . 当 有 序 的 代数 结构 具有 阿 基 米 德 性 质 
时 , 就 可 以 为 之 定义 高 效 的 找 出 商 和 余 的 算法 , 而 这 种 商 和 余 又 能 用 于 导出 求 
最 大 公 因 子 的 广义 欧 几 里 得 算法 . 对 一 些 相 关 的 逻辑 概念 , 如 协调 性 和 独立 性 ， 
这 里 只 做 简单 处 理 , 最 后 用 有 关 计 算 机 整数 算术 的 讨论 作为 总 结 . 


5.1 基本 代数 结构 


一 个 元 素 称 为 某 二 元 运算 的 单位 元 (identity element)， 如 果 它 与 任意 的 另 一 个 
元 素 组 合 时, 得 到 的 结果 总 是 那个 元 素 : 
property(T: Regular, Op : BinaryOperation) 
requires(T = Domain(Op)) 
identity.element : T x Op 
(e, op) — (Va € T) ор(а,е) = op(e,a) =a 


8138 5.1 单位 元 唯一 : 
identity_element(e, op) ^ identity element(e', op) = e = e^ 


空 串 是 串 拼接 运算 的 单位 元 . 矩阵 (50) Æ 2 x 2 和 矩阵 的 乘法 的 单位 元 , 而 
(90) 是 2 x2 矩阵 的 加 法 的 单位 元 . 

一 个 变换 称 为 某 二 元 运算 相对 于 一 个 给 定 元 素 (通常 取 该 二 元 运算 的 单 
位 元 ) BJ 3 i£ Ж. (inverse operation), 如 果 该 变换 满足 下 面 的 性 质 : 
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property(F : Transformation, T: Regular, Op : BinaryOperation) 
requires(Domain(F) = T = Domain(Op)) 
inverse operation : F x T x Op 


(inv, e, op) к> (Уа € T) op(a, inv(a)) = op(inv(a), а) = e 


引 理 5.2 v? RE IE SEN п Z 0 BE 5 的 乘法 逆 . 
一 个 二 元 运算 可 交换 (commutative), 如 果 其 参数 交换 位 置 后 结果 不 变 : 
property(Op : BinaryOperation) 
commutative : Op 
op ++ (Va, b € Domain(Op)) op(a, b) = op(b, a) 


ER, 函数 复合 是 可 结合 的 但 不 是 可 交换 的 . 

带 有 一 个 可 交换 运算 的 集合 称 为 一 个 半 群 (semigroup). 如 第 3 章 所 说 , 我 
们 总 用 + 表示 一 个 可 结合 且 可 交换 的 运算 , 因此 把 带 有 + 运算 的 类 型 称 为 一 
个 加 半 群 (additive semigroup): 


AdditiveSemigroup(T) 全 
Regular(T) 
人 十 :TXT 一 T 
人 associative( 十 ) 


^ commutative( 十 ) 


有 的 乘法 不 是 可 交换 的 , 矩阵 乘法 就 是 一 个 例子 . 


MultiplicativeSemigroup(T) 全 
Regular(T) 
A -:TxT— T 


A associative(-) 


我 们 使 用 如 下 记 法 : 
规程 | C++ 
乘法 | - * 
带 有 单位 元 的 半 群 称 为 么 半 群 (monoid). 加 法 的 单位 元 用 0 表示 , 由 此 得 
到 加 法 么 半 群 (additive monoid) 的 定义 : 
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AdditiveMonoid(T) È 
AdditiveSemigroup(T) 
A0ET 
A identity element(0, +) 


我 们 使 用 如 下 记 法 : 
规程 | С++ 
加 法 单位 元 | 0 | TCO) 
非 负 实数 是 一 个 加 法 么 半 群 , 以 自然 数 为 系数 的 矩阵 也 是 . 
乘法 的 单位 元 用 1 表示 , 由 此 可 以 得 到 乘法 么 半 群 (multiplicative monoid) 
的 定义 : 


MultiplicativeMonoid(T) 全 
MultiplicativeSemigroup(T) 
^1єт 
A identity_element(1, -) 


我 们 使 用 如 下 记 法 : 


规程 | C++ 
乘法 单位 元 | 1 |та) 


整数 系数 矩阵 是 一 个 乘法 么 半 群 . 
带 有 逆 运 算 的 么 半 群 称 为 群 (group). 如 果 一 个 加 法 么 半 群 有 逆 运 算 , 就 用 
一 元 的 一 表示 它 , 由 它 可 以 得 到 一 个 称 为 减 的 派生 运算 , 用 二 元 一 表示 .这样 
就 得 到 了 加 法 群 (additive group) 的 定义 : 
AdditiveGroup(T) 全 
AdditiveMonoid(T) 
和 人 一:T 一 T 
人 inverse.operation(unary —, 0, +) 
A =sTX TT 
(a,b) + a + (—b) 


整数 系数 矩阵 是 一 个 加 法 群 . 
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引 理 5.3 在 加 法 群 里 -0 = 0. 


正如 可 以 有 加 法 群 的 概念 一 样 , 存在 与 之 对 应 的 乘法 群 (multiplicative 
group) 的 概念 . Kc rp B CK 292 e ike ii, 由 它 得 到 的 二 元 派生 运算 称 为 除法 
(division), 用 二 元 / 表示 : 


MultiplicativeGroup(T) 全 
MultiplicativeMonoid(T) 
^ multiplicative_inverse : T — Т 
A inverse. operation(multiplicative. inverse, 1, -) 
A /:TxT— T 


(a, b) — а· multiplicative_inverse(b) 


multiplicative_inverse(x) id Ж x^. 

单位 圆 上 的 复数 {cos 0 + isin Ө) 是 一 个 可 交换 的 乘法 群 . Ж BEB GL, (Z) (47 
列 式 等 于 士 1 n x n 整 系数 矩阵 的 群 ) 是 一 个 不 可 交换 的 乘法 群 . 

同一 类 型 上 的 两 个 概念 可 以 用 关于 它们 的 运算 的 公理 组 合 起 来 . 当 一 个 
类 型 上 同时 有 + 和 . 运算 时 , 通过 公理 将 其 连接 可 以 定义 半 环 (semiring): 


Semiring(T) Š 
AdditiveMonoid(T) 
^ MultiplicativeMonoid(T) 
A0#1 
^ (Уа єТ)0.а=а:0=0 


A (Va, b,c € T) 
a-(b+c)=a-b+a-c 


А (b+c)-a=b-at+c-a 


有 关 乘 以 0 MAM RA 3 46 bk (annihilation property). KK + Al 的 最 
后 一 个 性 质 称 为 分 配 律 (distributive). 
具有 非 负 整 系数 的 矩阵 构成 一 个 半 环 . 


CommutativeSemiring(T) 全 
Semiring(T) 
^ commutative(-) 
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非 负 整数 构成 一 个 交换 半 环 . 


Ring(1) 全 
AdditiveGroup(T) 
^ Semiring(T) 


整 系数 矩阵 构成 一 个 环 (ring). 


CommutativeRing(T) 全 
AdditiveGroup(T) 


A CommutativeSemiring(T) 


整数 构成 一 个 交换 环 (commutative ring); 整 系数 多 项 式 构成 一 个 交换 环 . 
关系 概念 (relational concept) 是 定义 在 两 个 类 型 上 的 概念 . 半 模 (semimod- 
ule) 是 一 个 关系 概念 , 它 连接 一 个 加 法 么 半 群 和 一 个 交换 半 环 : 


Semimodule(T, S) 全 
AdditiveMonoid(T) 

^ CommutativeSemiring(S) 

Л -:5хт-т 

^ (Wa, В € S)(Va,b € T) 
«.(В-а) = (a-B)-a 
(a+B)-a = a-a+B-a 
a-(a+b) = a-at+a-b 


l‘a = а 


WRA Ѕетітойше(т, S), RUE TÆ S 上 的 一 个 半 模 . 这 里 借用 向 量 空间 的 
术语 , 称 T 的 元 素 为 向 量 (vector), S 的 元 素 为 标量 (scalar). 举例 说 , 非 负 整数 系 
数 的 多 项 式 构成 了 非 负 整数 上 的 一 个 半 模 . 


定理 5.1 AdditiveMonoid(T) > Semimodule(T, №), 这 里 的 标量 乘法 定义 为 n.x= 
е. 
Калаа 

nt 
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证 明 . 由 标量 乘法 的 定义 , 么 半 群 运算 的 可 结合 性 和 可 交换 性 直接 可 得 . 例如 ， 


n-atn-b=(at---+a)+(b+---+b) 
=(at+b)+---+(a+b) 
=n-(a+b) 口 


利用 第 3 章 的 power, 可 以 实现 在 logon 步 数 内 完成 乘 一 个 整数 的 算法 . 
通过 用 加 法 群 代替 加 法 么 半 群 , 用 环 代替 半 环 的 方式 强化 需求 , 可 以 把 半 
模 变换 为 模 : 


Module(T, S) 全 
Semimodule(T, S) 
^ AdditiveGroup(T) 
^ Ring(S) 


3138 5.4 每 个 加 法 群 是 整数 上 的 一 个 模 , 它 带 有 一 个 适当 定义 的 标量 乘法 , 


计算 机 里 的 一 个 类 型 通常 是 某 个 概念 的 一 个 部 分 模型 . 一 个 模型 称 为 是 
部 分 的 (partial), 如 果 相关 的 运算 在 有 定义 的 地 方 满足 公理 , 但 它们 并 不 是 处 
处 有 定义 . 例如 , 由 于 存储 有 限 , 串 拼接 的 结果 可 能 无 法 表示 , 但 只 要 结果 有 定 
义 , 拼接 运算 都 可 结合 . 


5.0 有 序 代 教 结构 


如 果 在 一 个 结构 上 定义 了 一 个 全 序 , 而 且 此 全 序 与 该 结构 的 代数 性 质 协 调 , 就 
称 其 为 该 结构 上 的 一 个 自然 全 序 (natural total ordering): 


OrderedAdditiveSemigroup(T) 全 
AdditiveSemigroup(T) 
^. TotallyOrdered(T) 
A (Wa,b,c € TJa<b=>a+c<b+c 


OrderedAdditiveMonoid(T) 全 


Ordered AdditiveSemigroup(T) 
^ AdditiveMonoid(T) 
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OrderedAdditiveGroup(T) 全 
OrderedAdditiveMonoid(T) 
^ AdditiveGroup(T) 


引 理 5.5 SUELE MIKE, BA a<bAc<d>atce<b+d 


引 理 5.6 对 一 个 可 以 看 作 自 然 数 上 的 半 模 的 有 序 加 法 么 半 群 ,总 有 a>0 人 n> 
0=>na>0. 


引 理 5.7 对 有 序 加 法 群 , 总 有 a < b > —b < 一 a. 
全 序 和 取 负 运算 使 我 们 可 以 定义 绝对 值 (absolute value): 


template<typename T> 

requires (OrderedAdditiveGroup(T)) 
T abs(const T& a) 
+ 

if (a < T(0)) return -a; 


else return a; 


下 面 引 理 说 明了 abs 的 一 个 重要 性 质 . 
引 理 5.8 在 一 个 有 序 加 法 群 里 a< 0 一 0< —a. 

我 们 用 la] 表示 a 的 绝对 值 . 绝对 值 满足 下 面 性 质 : 
引 理 5.9 


la — Ы = |b — al 
la + bl < la| + [b 
la — > lal — 1] 
[а] 20-2 a-20 


az 0- [а] 20 
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5.3 RE 


可 以 看 到 , 在 一 个 加 法 么 半 群 里 反复 做 加 法 就 得 到 非 负 整数 倍 的 乘法 . 在 加 法 
群 里 这 一 算法 可 以 逆行 , 即 通过 元 素 的 反复 减 得 到 a = nb 形式 的 商 , 表示 用 b 
除 a. 把 这 种 商 扩展 到 任意 元 素 之 间 的 带 余 除 法 , 需要 有 一 个 序 的 概念 . 该 序 使 
算法 可 以 在 不 能 再 减 时 终止 . 下 面 将 看 到 , 它 还 使 算法 可 以 只 需 对 数 步 就 能 完 
成 . 减 运算 并 不 需要 处 处 有 定义 , 只 需要 一 个 称 为 消除 (cancelation) 的 部 分 减 
法 就 可 以 了 , 其 中 的 a 一 b RE b 不 超过 a 时 有 定义 : 


CancellableMonoid(T) 全 
OrderedAdditiveMonoid(T) 
和 一 :TxT 一 T 
A (Va,bET)/b<a>a—b ЖЕ X^(a—b)-b—a 
这 里 把 公理 写成 (a 一 b) + b = a 而 不 是 (a+b) — b = a, 是 为 了 避免 部 分 模型 
CancellableMonoid H ILR H: 
template<typename T> 


requires (CancellableMonoid(T) ) 
T slow_remainder(T a, T b) 


t 
// 前 条 件 :a>0A 人 Ab>0 
while (b <= a) a = a - b; 
return a; 

} 


概念 CancellableMonoid 不 够 强 , 不 足以 证 明 slow-remainder 终止 . 例如 , 对 
于 项 按 字典 序 排列 的 整 系数 多 项 式 , slow remainder 并 不 总 终止 . 


练习 5.1 请 给 出 两 个 整 系数 多 项 式 实例 , 上 述 算法 对 它们 不 终止 . 


要 保证 算法 终止 , 还 需要 另 一 个 称 为 阿 基 米 德 公理 (Axiom of Archimedes) 
的 性 质 :! 


1.&... (#1) 不 相等 的 面积 中 较 大 者 超出 较 小 者 的 超出 部 分 反复 自 加 , 可 以 超过 任何 有 限 的 面 
积 .” 见 Heath [1912, 234 页 ]. 
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ArchimedeanMonoid(T) Š 
CancellableMonoid(T) 
^ (Va,b € T) (a 2 0 A b > 0) = slow_remainder(a, b) 终止 
A QuotientType : ArchimedeanMonoid — Integer 


可 以 看 到 这 一 算法 的 终止 是 一 个 正当 的 公理 , 在 目前 情况 下 它 等 价 于 
(3n € QuotientType(T))a—n-b<b 


阿 基 米 德 公 理 通 常 被 说 成 “存在 整数 n 使 得 a < n.b” 上 述 定 义 对 部 分 的 
FT ЖЖЖ А 3 #& (Archimedean monoid) 有 效 , 其 中 n-b 可 能 溢出 . 类 型 函数 
QuotientType 返回 一 个 足以 表示 slow. remainder 所 执行 的 迭代 次 数 的 类 型 . 


引 理 5.10 下 面 是 一 些 阿 基 米 德 么 半 群 的 例子 : OH. ABM. RDM 
(kh SM (a) 和 实数 . 


很 容易 修改 slow. remainder 的 代码 , 要 求 它 返回 商 : 


template<typename T> 
requires(ArchimedeanMonoid(T)) 
QuotientType(T) slow.quotient(T a, T b) 
t 
// 前 条 件 :a>0Ab>0 
QuotientType(T) n(0); 
while (b <= a) { 
a=a- b; 
п = successor (n); 
} 


return n; 


反复 加 倍 可 以 得 到 对 数 复杂 性 的 power 算法 . 与 之 相关 的 另 一 个 算法 可 以 
求 出 余数 .? 基于 a 除 以 2b 的 余数 v, 可 以 推导 出 下 面 这 个 描述 а 除 以 2b 的 余 
Hu 的 表达 式 : 

a=n(2b)+v 





2. 古 埃及 人 用 这 一 算法 做 带 余 除法 , НКИ k Se. ML Robins and Shute [1987, 18 页 ]. 
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由 于 v 必须 小 于 除数 2b, 所 以 


v ifv<b 


v—b ifv2b 


这 就 给 出 了 下 面 的 递归 过 程 : 


template<typename T> 
requires (ArchimedeanMonoid(T) ) 


T remainder_recursive(T a, T b) 


t 
// 前 条 件 : a 2 b > 0 
if (a - b >= b) { 
a = remainder_recursive(a, b + b); 
if (a < b) return a; 
} 
return a - b; 
} 


检查 a 一 b>>b 而 不 是 a>b+b 可 以 避免 b+b REH. 


template<typename T> 
requires(ArchimedeanMonoid(T)) 


T remainder nonnegative(T a, T b) 


{ 

// MATE: a>0Ab>0 

if (a < b) return a; 

return remainder recursive(a, b); 
} 


练习 5.2 请 分 析 remainder_nonnegative 的 复杂 性 . 


[Floyd and Knuth 1990] 提 出 了 一 个 常量 空间 的 阿 基 米 德 么 半 群 的 求 余 算 
法 , 它 比 remainder_nonnegative 大 约 多 执行 31% 的 运算 . 而 如 果 可 以 用 除 2 运算 , 
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就 存在 不 增加 运算 的 算法 .3 似乎 在 许多 情景 中 都 有 这 种 现象 . 例如 , 虽然 用 直 
尺 和 圆规 不 可 能 做 一 个 角 的 一 般 性 -分 式 , 但 做 两 分 却 极 其 简单 . 


HalvableMonoid(T) 全 
ArchimedeanMonoid(T) 
A half i T— T 
^ (Va,b E€ T) (b >OAa=b+b) = half(a) =b 


请 注意 , half 只 需 对 “偶数 "元素 有 定义 . 


template<typename T> 
requires (HalvableMonoid(T) ) 
T remainder nonnegative.iterative(T a, T b) 
t 
// 前 条 件 : a>0Ab>0 
if (a < b) return a; 
T c = largest-doubling(a, b); 
a =a - с; 
while (c != b) { 
c = half(c); 
if (c <= а) a =a - с; 
} 
return a; 


k 
其 中 的 过 程 largest-doubling 定义 如 下 : 


template<typename T> 
requires(ArchimedeanMonoid(T)) 
T largest_doubling(T a, T b) 
1 
// WE: a2 o0 
while (b <= a - b) b = b + b; 





3. Dijkstra [1972, 13 页 ] 将 此 算法 归功 于 N. G. de Bruijn. 
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return b; 


remainder. nonnegative iterative 的 正确 性 依赖 于 下 面 引 理 . 
引 理 5.11 对 可 二 分 么 半 群 的 正 元 素 加 倍 k 次 , 得 到 的 结果 也 可 以 折 半 k 次 . 


对 非 可 二 分 的 阿 基 米 德 么 半 群 就 只 需要 remainder nonnegative. 前 面 给 出 
的 实例 (лаал аав. наж. жонс) 都 是 可 二 分 
的 . 


项 目 5.1 是 否 存在 是 阿 基 米 德 么 半 群 , 但 不 是 可 二 分 么 半 群 的 有 用 模型 ? 


5.4 最 大 公 因 子 
对 阿 基 米 德 么 半 群 T 里 的 a>0 和 b>0, 可 整除 性 (divisibility) 定义 如 下 : 
b 整除 a = (3n € QuotientType(T)) a = nb 
引 理 5.12 对 于 阿 基 米 德 么 半 群 T 里 的 正 元 素 x, ab: 
e b 整除 a < remainder nonnegative(a, b) = 0 
ob Rao b <a 
* q >b Ax BR a Ax BR b — x BH (a— b) 
о x HEBR a A x HEBR b = x ҖЕ remainder. nonnegative(a, b) 


а Alb @) А B] + (greatest common divisor) 用 gcd(a, b) 表示 . THE a 和 
b 的 因子 , 而 且 能 被 a 和 ， 任何 公 因子 整除 


引 理 5.13 在 阿 基 米 德 么 半 群 里 , 下 面 性 质 对 正 元 素 x, ab 成 立 : 
© ged 可 交换 


。 gcd 可 结合 





4. 虽 然 这 一 定义 对 阿 基 米 德 么 半 群 有 效 , 但 它 并 不 依赖 于 序 关系 , 因此 可 以 扩展 到 其 他 带 有 可 
整除 关系 的 结构 , 例如 环 . 
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e x BR a A x BK b = x < ged(a,b) 
© gcd(a, b) 唯一 
e gcd(a, a) =a 
e a >b = gcd(a,b) = gcd(a — b, b) 


由 前 面 引 理 立即 可 知 , 如 果 下 面 算法 终止 , 它 将 返回 参数 的 gcd:5 


template<typename T> 
requires (ArchimedeanMonoid(T)) 
T subtractive gcd nonzero(T a, T b) 


Y 
// 前 条 件 :a> 0^0 20 
while (true) { 
if (b < a) a-a-b; 
else if (а < b) b=b- a; 
else return a; 
} 
} 


引 理 5.14 对 整数 和 有 理 数 , 上 面 算法 总 能 终止 . 


也 存在 一 些 类 型 , 上 述 算 法 对 于 它们 并 不 总 终止 . 例如 对 于 实数 它 就 不 一 
定 终止 , 比如 对 输入 V2 和 1 不 会 终止 . 这 一 事实 的 证 明 依赖 于 下 面 两 个 引 理 : 


引 理 5.15 ged( сър galan) = 1 
引 理 5.16 如 果 整 数 n 的 平方 根 是 偶数 , 那么 п 也 是 偶数 . 
定理 5.2 subtractive_gcd_nonzero( /2, 1) 不 终止 . 


证 明 . 假设 subtractive_gcd_nonzero(V2,1) 终止 并 返回 d. 5 т = A Жп=1. h 
引 理 5.15, m 和 n 没有 大 于 1 的 公 因 子 . H = = У = V5, 所 以 m2 = 2n2; m Ж 





5. 这 个 算法 称 为 欧 几 里 得 算法 [Heath 1925, 第 3 卷 , 14-22 Д]. 
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偶数 ; 对 某 个 整数 u, m = 2u. 由 于 4u2 = 2n2, 所 以 n? = 202; п 是 偶数 . 这 样 m 
和 nm 都 能 被 2 整除 ; 矛盾 .4 口 


一 个 欧 几 里 得 么 半 群 (Euclidean monoid) 是 一 个 阿 基 米 德 么 半 群 , 如 果 在 
其 中 做 subtractive_gcd_nonzero 必定 终止 : 


EuclideanMonoid(T) 全 
ArchimedeanMonoid(T) 
^ (Va,b € T) (a > OA b > 0) => subtractive всі nonzero(a, b) 终止 


3| BB. 5.17 每 个 有 最 小 正 元 素 的 阿 基 米 德 么 半 群 都 是 欧 几 里 得 的 . 
引 理 5.18 有 理 数 是 一 个 欧 几 里 得 么 半 群 . 


很 容易 扩充 subtractive_gcd_nonzero, 使 之 可 以 处 理 一 个 参数 是 0 的 情况 ， 
AEE o Z 0 都 整除 该 么 半 群 的 0 元: 


template<typename T> 
requires (EuclideanMonoid(T)) 
T subtractive.gcd(T a, T b) 


1 
// WHE: a2 0^0 20A^-(a—0Av-—0) 
while (true) { 
if (b == T(0)) return a; 
while (b <= a) a = a - b; 
if (a == T(0)) return b; 
while (a <= b) b = b - a; 
} 
š 


subtractive.gcd 里 每 个 内 层 的 while 语句 等 价 于 对 slow_remainder 的 一 次 调 
用 . 利用 前 面 的 对 数 时 间 求 余 算 法 , 在 a 和 ob 量 级 差异 很 大 时 的 操作 可 以 大 大 
ж. 算法 只 依靠 类 型 T 上 最 基本 的 减法 : 


6. 一 个 正方 形 的 边 和 对 角 线 不 可 公 度 , 这 是 希腊 人 发 现 的 最 早 证 明之 一 . NE HE + Ф{# 在 Prior 
Analytics 1. 23 里 将 它 作为 通过 反 证 法 (reductio ad absurdum) 证 明 的 范例 . 





Download at р: // www pinsi.com, 


5.5 F 3. ged 79 


template<typename T> 
requires (EuclideanMonoid(T)) 
T fast_subtractive_gcd(T a, T b) 


{ 
// 前 条 件 : a > ОЛЪ> ОЛ (а = 0ЛЬ = 0) 
while (true) { 
if (b == Т(0)) return a; 
a = remainder_nonnegative(a, b); 
if (a == Т(0)) return b; 
b = remainder nonnegative(b, a); 
} 
} 
欧 几 里 得 么 半 群 的 概念 是 对 欧 几 里 得 算法 的 一 种 抽象 , 它 只 依靠 反复 做 减 
法 . 
5.5 广义 gcd 


对 整数 可 以 用 fast_subtractive всё, 因为 整数 构成 一 个 欧 几 里 得 么 半 群 , 对 整数 
还 可 以 用 系统 内 部 的 求 余数 运算 而 不 用 remainder_nonnegative. 进一步 说 , 这 一 
算法 对 某 些 非 阿 基 米 德 域 也 可 以 工作 , 只 要 相应 的 域 有 一 个 合适 的 求 余 函数 ， 
标准 的 长 除 算法 很 容易 从 十 进 制 整数 扩展 到 实数 上 的 多 项 式 ,” 利 用 这 样 的 求 
余 函 数 就 能 计算 两 个 多 项 式 的 ged T. 

与 欧 几 里 得 算法 相对 应 , 抽象 代数 还 引进 了 欧 几 里 得 半 环 (Euclidean 
semiring) 的 概念 (也 称 为 欧 几 里 得 域 ). 实际 上 , 要 求 半 环 就 足够 了 : 


EuclideanSemiring(T) 全 
CommutativeSemiring(T) 
^ NormType : EuclideanSemiring — Integer 
^ м: T— NormType(T) 





7. W, Chrystal [1904, 第 5 Ж]. 
8. W, van der Waerden [1930, 第 3 Ж, Ж 18 5]. 
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^ (Va € T) w(a) > 0 

^ (Vae Т) м(а) =0 HS a=0 

^ (Va, b € T)b #0 > w(a - b) > w(a) 

A remainder: Tx T— T 

A quotient: Tx T— T 

^ (Va,b € T) b #0 = а = quotient(a, b) - b + remainder(a, b) 
^ (Va,b € T) b #0 => w(remainder(a, b)) < w(b) 


这 里 的 w 称 为 欧 几 里 得 函数 (Euclidean function). 
引 理 5.19 EKLERE E, a-b 0 a—-0Vb = 0. 
template<typename T> 


requires(EuclideanSemiring(T)) 
T gcd(T a, T b) 


t 
// 前 条 件 : (а = 0 Ab = 0) 
while (true) { 
if (b == T(0)) return a; 
a = remainder(a, b); 
if (a == T(0)) return b; 
b = remainder(b, a); 
k 
} 


可 以 看 出 , 这 里 不 是 必须 用 remainder_nonnegative, 也 可 以 用 相应 类 型 里 定 
义 的 remainder 函数 . 每 次 应 用 remainder 总 使 w 减 小 , 这 一 事实 保证 了 终止 性 . 


引 理 5.20 gcd 在 欧 几 里 得 半 环 里 终止. 


在 欧 几 里 得 半 环 里 , quotient 总 返回 半 环 里 的 一 个 元 素 . 这 就 排除 了 使 用 欧 
几 里 得 原 框架 的 条 件 : 任意 两 个 可 公 度 的 量 都 可 确定 一 个 公共 的 度量 . 例如 ， 
gcd(3, 2) = 1. 可 以 用 欧 几 里 得 半 模 (Euclidean semimodule) 的 概念 统一 原 框架 
和 新 框架 , 欧 几 里 得 半 模 允许 quotient 返回 其 他 类 型 的 值 , 而 把 gcd 的 终止 性 作 
为 公理 : 
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EuclideanSemimodule(T, S) 全 
Semimodule(T, S) 
^ remainder: Tx T— T 
A quotient: Tx T S 
^ (Va,b € T) b #0 = a = quotient(a, b) - b + remainder(a, b) 
^ (Va,b € T) (a Z 0 V b #0) => gcd(a, b) 终止 


其 中 gcd 定义 为 


template<typename T, typename S> 
requires (EuclideanSemimodule(T, S)) 
T gcd(T a, T b) 


t 
// 前 条 件 : ~la =0 Ab = 0) 
while (true) ( 
if (b == T(0)) return a; 
a = remainder(a, b); 
if (а == T(0)) return b; 
b = remainder(b, a); 
+ 
} 


由 于 每 个 可 交换 的 半 环 都 是 定义 在 它 自己 上 的 半 模 , A quotient 返回 同 
一 个 类 型 , 这 个 算法 就 可 以 用 , 例如 对 于 实数 上 的 多 项 式 . 


5.6 Stein gcd 
1961 年 Josef Stein 发 明了 一 个 新 的 整数 gcd 算法 , 该 算法 经 常 比 欧 几 里 得 算法 
快 一 些 [Stein 1967]. 这 个 算法 依赖 于 下 面 两 个 性 质 : 


gcd(a, b) = ged(b, a) 
gcd(a, a) =a 
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还 有 对 所 有 a > b > 0 的 如 下 性 质 : 
gcd(2a, 2b) = 2 gcd(a, b) 
gced(2a, 2b + 1) = ged(a, 2b + 1) 
gcd(2a + 1, 2b) = gcd(2a + 1, b) 
gcd(2a + 1,2b + 1) = gcd(2b + 1,a — b) 


练习 5.3 请 实现 整数 的 Stein ged 算法 , 并 证 明 其 终止 性 . 


看 起 来 Stein ged 似乎 依赖 于 整数 的 二 进 制 表示 , 但 2 是 最 小 素 整 数 的 事 
实 使 该 算法 可 以 推广 到 其 他 的 域 , 其 中 使 用 该 域 的 最 小 素 元 素 . 例如 , 对 于 多 项 
R, 可 以 用 x 的 一 个 单项 式 ,? 对 高 斯 整数 , 用 1+i10 Stein ged 算法 也 可 以 用 于 
非 欧 几 里 得 环 .也 


项 目 5.2 请 找 出 保证 Stein god 的 既 正 确 又 具 普 遍 性 的 框架 . 


5.7 商 


对 快速 求 商 和 余数 的 推导 , 与 前 面 有 关 快 速 余数 的 推导 正好 是 平行 的 , 现在 要 
从 a 除 以 b 推导 出 一 个 有 关 商 m 和 余数 u 的 表达 式 ,用 a 除 以 2b 的 商 n 和 余 
Hv RM: 


a=n(2b)+v 


由 于 余数 v 必然 小 于 除数 20, 就 有 
v ifv<b 
u= 
v—b ifv>b 


2n ifv<b 
m= 
2n+1 ifv>b 
9. W, Knuth (1997, 练习 4.6.1.6 (435 页 ) 及 其 解 (673 页 )]. 


10. 见 Weilert [2000]. 
11. 见 Agarwal and Frandsen [2004]. 


以 及 
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这 样 就 得 到 了 下 面 的 代码 : 


template<typename T> 
requires (ArchimedeanMonoid(T)) 
pair<QuotientType(T), T> 


quotient remainder nonnegative(T a, T b) 


1 
// 前 条 件 :a> 0^0 0 
typedef QuotientType(T) N; 
if (a < b) return pair«N, T>(N(O), a); 
if (a - b < b) return pair<N, T>(N(1), a - b); 
pair<N, Т> q = quotient remainder nonnegative(a, b + b); 
N m = tvice(q.m0); 
a 7 q.mi; 
if (a « b) return pair<N, T>(m, a); 
else return pair«N, T»(successor(m), a - b); 
} 


WRAP” (halving) 操作 , 就 可 以 得 到 下 面 代 码 : 


template<typename T> 

requires (HalvableMonoid(T) ) 
pair<QuotientType(T), T> 
quotient remainder nonnegative iterative(T a, T b) 
t 

// W fF: a >0Ab>0 

typedef QuotientType(T) N; 

if (а < b) return pair<N, T»(N(0), a); 

T c = largest doubling(a, b); 

а=а- с; 

N n(1); 

while (c != b) { 


n = twice(n); 


83 
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с = half(c); 
if (c <= a) í 
а= в = с; 


n = successor(n); 


} 
return pair<N, T>(n, a); 


5.8 负 量 的 商 和 余数 


许多 计算 机 教授 和 程序 设计 语言 对 负 量 的 商 和 余数 的 定义 都 是 不 对 的 . 作为 
有 关 阿 基 米 德 么 半 群 的 定义 的 扩展 , 阿 基 米 德 群 (Euclidean group) T 必须 满足 
下 面 性 质 , 其 中 的 b Z 0: 


a = quotient(a, b) - b + remainder(a, b) 
|remainder(a, b)| < |b] 


remainder(a + b, b) = remainder(a — b, b) = remainder(a, b) 


最 后 一 个 性 质 等 价 于 经 典 数学 里 同 余 (congruence) BU Ж X..12 有 关 数 论 的 
书籍 里 通常 假定 b > 0, 可 以 将 remainder 相 容 地 扩展 到 b < 0 的 情况 . 如 果 求 
余 的 实现 将 商 向 零 的 方向 截取 , 就 会 违背 上 面 的 第 3 Ж, 从 而 不 满足 我 们 的 需 
求 .3 除了 违背 上 面 的 第 3 条 要 求 外 , 截取 还 是 一 种 低劣 的 约 简 方法 , 因为 它 送 
出 0 的 次 数 是 送出 任何 其 他 整数 的 次 数 的 两 倍 , 这 导致 了 一 种 不 一 致 的 分 布 . 

要 给 出 满足 上 面 对 非 负 输 入 的 三 条 要 求 的 求 余数 过 程 rem 和 求 商 过 程 
quo.rem, 可 以 写 两 个 适配器 过 程 , 使 之 对 于 正 的 和 负 的 整数 都 给 出 正确 结果 . 
这 些 适配器 过 程 可 以 用 在 阿 基 米 德 群 上 : 





12. “如 果 两 个 数 a RI b 相对 于 同一 模 数 kk 有 同样 的 余数 7, 则 称 它们 相对 于 模 数 k AR ( 源 自 
高 斯 )”[Dirichlet 1863]. 

13. 关 于 商 和 余数 的 卓越 讨论 参见 Boute [1992]. Boute 指出 了 两 个 可 以 接受 的 扩充 , 分 别称 为 
ЕЖЕ. 我 们 将 采用 Knuth 更 喜欢 的 被 Boute 称 为 了 的 扩充 . 
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ArchimedeanGroup(T) 全 
ArchimedeanMonoid(T) 
^ AdditiveGroup(T) 


template<typename Op> 
requires(BinaryOperation(Op) && ArchimedeanGroup(Domain(0p))) 
Domain(Op) remainder(Domain(Op) a, Domain(Op) b, Op rem) 
{ 
// WEE: b #0 
typedef Domain(Op) T; 
Т ту 
if (a « T(0) 
if (b < Т(0)) 4 
г = -ren(-a, -b); 
) else { 
r= rem(-a, b); if (r != Т(0)) r=b- r; 
+ 
else 
if (b < T(0) { 
r= rem(a, -b); if (r != TO r = b + r; 
} else { 
r= rem(a, b); 
} 


return r; 


template<typename F> 
requires(HomogeneousFunction(F) && Arity(F) == 2 && 
ArchimedeanGroup(Domain(F)) && 
Codomain(F) == pair<QuotientType (Domain(F)), 
Domain(F)>) 


pair<QuotientType (Domain(F)), Domain(F)> 


85 
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quotient_remainder(Domain(F) a, Domain(F) b, F quo rem) 
t 
// WA PE: ъ Z 0 
typedef Domain(F) T; 
pair<QuotientType(T), T> qr; 
if (a < T(0) í 
if (b < T(0)) € 
qr = quorem(-a, -b); q r.ml = -qr.mi; 
} else { 
qr = quorem(-a, b); 
if (qr.ml != T(0)) { 
qr.mi = b - qr.ml; q-r.m0 = successor(q.r.m0); 
i 
q-r.m0 = -q r.m0; 
} 
} else { 
if (b < T(0) { 
qr = quo rem( a, -b); 
if (q-r.m1 != T(0) 4 
q.r.mi = b + q-r.ml; q-r.mO = successor(q.r.m0); 
J 
q-r.m0 = -q-r.m0; 
£ 
else 
q-r = quo-rem( a, b); 
$ 


return q-r; 


8| 5.21 只 要 remainder 和 quotient remainder 的 函数 参数 满足 对 于 正 参 数 的 
要 求 , 这 两 个 过 程 就 能 满足 我 们 的 要 求 . 
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5.9 概念 及 其 模型 


从 第 2 章 起 我 们 一 直 使 用 整数 类 型 , 但 是 并 没有 给 出 这 个 概念 的 形式 化 定义 . 
本 章 前 面部 分 定义 了 有 序 代数 结构 , 在 此 基础 上 已 经 可 以 形式 化 地 处 理 整 数 
T. 首先 定义 离散 阿 基 米 德 半 环 (discrete Archimedean semiring): 


DiscreteArchimedeanSemiring(T) 全 
CommutativeSemiring(T) 
^ ArchimedeanMonoid(T) 
A (Va,bice Ja<bA0<c=a:-c<b:c 
^ ^(JaeT)Oca«1 


离散 性 (discreteness) 就 是 指 上 面 的 最 后 一 条 性 质 , 即 , 在 0 和 1 之 间 不 存 
在 任何 元 素 . 
离散 的 阿 基 米 德 半 环 可 以 有 负 元 素 . 与 负 元 素 不 存在 相关 的 概念 是 


NonnegativeDiscreteArchimedeanSemiring(T) 全 
DiscreteArchimedeanSemiring(T) 
^ (Vae T)O€a 


离散 阿 基 米 德 半 环 不 存在 加 法 的 逆 ; 与 加 法 逆 相 关 的 概念 是 


DiscreteArchimedeanRing(T) 全 
DiscreteArchimedeanSemiring(T) 
^ AdditiveGroup(T) 


两 个 类 型 T 和 1T' аж (isomorphic), 如 果 可 能 写 出 从 T 到 下 以 及 从 T 到 T 
的 转换 函数 , 它们 能 保持 两 个 类 型 的 过 程 及 公理 . 

一 个 概念 是 单 叶 的 (univalent), 如 果 任 何 满足 它 的 概念 都 相互 同 构 , 概念 
NonnegativeDiscreteArchimedeanSemiring 是 单 叶 的 ; 满足 它 的 类 型 都 与 自然 数 
类 型 N 同 构 .!4 DiscreteArchimedeanRing 也 是 单 叶 的 ; 满足 它 的 类 型 都 与 整数 
类 型 Z 同 构 . 正如 在 上 面 看 到 的 , 增加 新 公理 将 导致 满足 概念 的 模型 的 减少 ， 
使 得 一 个 概念 很 快 达到 一 个 单 叶 点 . 


14. 我 们 按照 Peano [1908, 27 Д] 的 定义 将 0 包含 在 自然 数 中 . 
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本 章 将 继续 以 演绎 的 方式 工作 , 通过 增加 运算 和 公理 , 从 比较 一 般 的 概念 
演绎 出 更 特殊 的 概念 . 这 一 推导 方法 能 静态 地 展示 一 个 概念 以 及 与 其 相关 定 
理 和 算法 的 分 类 体系 . 实际 的 发 现 过 程 则 按 归纳 的 方式 进行 , 从 如 整数 或 实数 
一 类 的 具体 模型 开始 , 去 掉 一 些 运 算 和 公理 , 设法 找到 某 些 有 趣 的 算法 还 能 继 
续 应 用 的 最 弱 概 念 . 


在 定义 一 个 概念 时 , 必须 验证 其 公理 的 独立 性 和 协调 性 , 并 阐明 其 有 用 人性. 


一 个 命题 独立 于 (independence of) 一 集 公理 , 如 果 存 在 一 个 模型 使 这 些 公 
理 都 为 真 , 但 是 这 一 命题 却 为 假 . 例如 , 可 结合 性 与 可 交换 性 相互 独立 : 串 拼接 
可 结合 但 不 可 交换 , 而 两 个 值 的 平均 值 (у) 可 交换 但 不 可 结合 . 一 个 命题 依 
HF (dependent) 一 集 公理 , 如 果 它 可 以 由 这 些 公理 导出 . 


一 个 概念 是 协调 的 (consistency)， 如 果 它 存在 模型 . 继续 我 们 的 例子 , 自然 
数 的 加 法 是 可 交换 且 可 结合 的 . 一 个 概念 是 不 协调 的 (inconsistency), MRA Ж 
个 命题 和 它 的 否定 都 可 以 由 这 个 概念 的 公理 集合 导出 . 换 句 话说 , И 
概念 的 协调 性 , 我 们 只 需要 构造 出 它 的 一 个 模型 ; 要 阐释 其 不 协调 性 , 只 需要 推 
导出 一 个 矛盾 . 


一 个 概念 是 有 用 的 (usefulness), 如 果 存在 某 个 有 用 的 算法 , 使 得 这 一 概念 
是 该 算法 的 最 抽象 的 场景 . 举例 说 , 并 行 的 不 考虑 顺序 的 归 约 适用 于 任何 可 结 
合 且 可 交换 的 运算 . 


5.10 计算 机 整数 类 型 


计算 机 指令 集 通 常 提供 自然 数 和 整数 的 某 种 部 分 表示 . 例如 可 能 有 一 个 有 
界 无 符号 二 进 制 整数 类 型 (bounded unsigned binary integer type) Un, 其 中 的 
n = 8,16,32,64,..., 它 可 以 表示 区 间 [0,2") 里 的 任何 值 . 男 有 一 个 有 界 的 带 
符号 整数 类 型 (bounded integer type) Sa, n = 8,16,32,64,..., 它 能 表示 区 间 
[-2^-1,2^-1) 里 的 任何 值 . 虽然 这 些 类 型 是 有 界 的 , 典型 的 计算 机 指令 实现 的 
却 是 它们 上 面 的 全 运算 , 将 结果 都 编码 为 有 界 值 的 二 元 组 . 
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对 于 有 界 无 符号 类 型 , 通常 存在 具有 下 面 签 名 的 指令 : 


sum.extended : Un x Un x Ui 一 Uy x Un 
difference extended : И, x U, x Ui — Ui x Un 
product. extended : И, x Ц, — Uo, 


quotient remainder. extended : Un x Un — Un x Un 


注意 , Un 可 以 表示 为 U, x Un (一 对 Un). 如 果 程 序 语言 提供 了 对 这 些 硬 件 运 
算 的 完全 访问 , 就 可 能 用 它 写 出 涉及 整数 类 型 的 高 效 的 抽象 的 软件 部 件 . 

WA 5.3 请 为 有 界 的 无 符号 和 带 符号 二 进 制 整数 设计 一 组 概念 . 有 关 现代 计 
算 机 体系 结构 的 研究 已 经 弄 清 了 它 应 该 包含 的 功能 . MMIX 是 这 些 指令 集合 的 
一 个 很 好 的 抽象 [Knuth 2005]. 


5.11 结论 


可 以 将 各 种 算法 和 数学 结构 无 颖 地 组 合 为 一 个 整体 , 方法 是 用 抽象 的 术语 来 
描述 算法 , 并 根据 算法 的 需要 去 调整 理论 . 本 章 的 数学 和 算法 是 一 些 已 有 两 千 
多 年 历史 的 结果 的 重新 叙述 . 
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第 6 章 
迭代 器 


ni 它 是 算法 和 顺序 数据 结构 之 间 的 接口 . SEN 8 E, 
念 的 一 种 分 层 结 构 说 明了 不 同类 型 的 顺序 遍历 : 一 遍 前 向 的 、 多 遍 前 向 的 、 
双向 的 , 以 及 随机 访问 .! 我 们 将 考察 一 些 常见 算法 (如 线性 和 二 分 检索 ) 的 各 
种 接口 有 界 和 计数 范围 是 为 各 种 顺序 算法 定义 接口 的 很 灵活 的 机 制 . 


6.1 可 读 性 


每 个 对 象 有 一 个 地 址 , 即 , 到 计算 机 内 存 的 一 个 整数 索引 . 程序 通过 地 址 访问 和 
修改 对 象 . 此 外 , 地 址 还 使 程序 可 以 创建 各 种 各 样 的 数据 结构 , 其 中 许多 结构 依 
赖 于 一 个 事实 : 地 址 就 是 整数 , 可 以 应 用 与 整数 类 似 的 运算 . 

Ж AX B (iterator) 是 一 族 概念 , 它们 抽象 了 地 址 的 不 同方 面 , 使 写 出 的 算法 
不 仅 可 以 对 地 址 工作 , 而 且 能 对 任何 满足 最 小 的 一 集 需 求 的 类 似 地 址 的 对 象 
工作 . 第 7 章 将 介绍 一 个 更 广泛 的 概念 族 : 坐标 结构 (coordinate structures). 

迭代 器 上 有 两 类 运算 : 访问 值 和 遍历 . 存在 三 种 访问 : 读 、 写 , 以 及 读 和 写 . 
存在 四 种 线性 遍历 : 一 遍 前 向 的 (输入 流 )、 多 遍 前 向 的 ( 单 链表 )、 双 向 的 (XX 
链表 ) 和 随机 访问 (数组 ). 

本 章 研究 第 一 种 访问 : 可 读 性 , 也 就 是 说 , 获得 被 另 一 个 对 象 指称 的 对 象 
的 值 的 能 力 . 一 个 类 型 T 是 可 读 的 (readable), 如 果 其 上 定义 了 一 个 一 元 函数 
source, 该 函数 返回 一 个 类 型 为 ValueType(T) 的 对 象 : 


Readable(T) 全 
Regular(T) 





1. RBA OX HOA Z t Ap BZ Stepanov and Lee [1995] 工作 的 精 化 , 但 又 在 几 个 方面 与 之 不 同 . 
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A ValueType : Readable 一 Regular 
A source : T — ValueType(T) 


source 只 在 需要 值 的 上 下 文中 使 用 , 其 结果 可 作为 值 或 者 常量 引用 传 给 过 程 . 

可 读 类 型 里 也 可 能 存在 使 source 无 定义 的 对 象 ; 也 就 是 说 source 不 必 是 全 
的 . 相关 概念 不 提供 定义 空间 谓词 来 帮助 确定 source 是 否 对 某 特定 对 象 有 定 
义 . 举例 说 , 给 了 一 个 指向 类 型 T 的 指针 , 不 可 能 确定 它 是 否 指 着 一 个 具有 合法 
结构 的 对 象 . 算法 里 使 用 函数 source 的 合法 性 只 能 通过 前 条 件 推导 出 来 . 

对 某 可 读 类 型 的 一 个 对 象 , 以 调用 source 的 方式 访问 之 , 这 一 访问 在 效率 
上 将 不 劣 于 通过 其 他 任何 方式 访问 同一 数据 . 特别 的 , 对 位 于 内 存 的 一 个 可 读 
的 具有 值 类 型 T 的 对 象 , 我 们 期 望 执行 source 的 代价 近似 等 于 对 一 个 到 的 常 
规 指针 做 间接 访问 的 代价 . 当然 , 就 像 常规 指针 一 样 , 这 里 也 可 能 出 现 由 于 存 
储 器 结构 而 带 来 的 代价 不 统一 的 情况 . 总 而 言 之 , 上 面 说 法 也 就 是 想 说 明 , së 
全 没有 必要 为 加 速 一 个 算法 而 考虑 用 指针 来 代替 迭代 器 . 

扩展 source 的 定义 , 使 之 可 以 用 于 那些 其 对 象 并 不 指向 其 他 对 象 的 类 型 ， 
这 种 做 法 也 可 能 很 有 用 . 这 里 的 做 法 是 , 在 source 作用 于 这 种 对 象 时 , 就 让 
它 直接 返回 自己 的 参数 ,这 一 假设 使 我 们 可 以 在 程序 里 以 统一 的 方式 描述 
对 可 读 对 象 的 值 需求 , 无 论 是 对 类 型 T 本 身 , 或 是 对 指向 类 型 T 的 指针 , 或 
是 更 一 般 的 , 对 任何 值 类 型 为 T 的 对 象 . 因此 , 除非 另 有 定义 , 我 们 总 假定 有 
ValueType(T) = Т, 而 此 时 source 返回 它 所 作用 的 对 象 . 


6.2 BRE 


要 做 遍历 , 就 需要 有 生成 新 欠 代 器 的 功能 . 正如 在 第 2 章 里 已 经 看 到 的 , 变换 是 
一 种 生成 某 类 型 的 新 值 的 方法 . 而 如 果 一 个 变换 是 规范 的 , 某 些 一 遍 算 法 就 可 
以 不 要 求 遍 历 的 规范 性 . 进一步 说 , 确实 有 一 些 模型 不 能 提供 规范 遍历 , 例如 
输入 流 . 这 样 , 最 弱 的 迭代 器 概念 只 要 求 久 变换 (pseudotrasformation)? successor 
和 类 型 函数 DistanceType: 


Iterator(T) 全 
Regular(T) 





2. 伪 变换 具有 与 变换 一 样 的 签名 , 但 它们 不 是 规范 的 . 
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A DistanceType : Iterator — Integer 
人 successor : T — T 


A successor 不 必 是 规范 的 


DistanceType 返回 一 个 整数 类 型 , 其 规模 足以 度量 相应 的 迭代 器 类 型 所 多 
许 的 successor 应 用 的 任意 序列 的 长 度 . 由 于 本 书 默认 地 假定 了 规范 性 , 所 以 现 
在 必须 明确 说 明 , 对 successor 并 没有 规范 性 的 要 求 . 

与 作用 于 可 读 类 型 的 source 一 样 , successor 也 不 必 是 全 的 . 在 迭代 器 类 型 
里 可 能 存在 使 得 successor 无 定义 的 对 象 . 有 关 的 概念 并 不 为 successor 提供 可 
用 于 确定 它 是 否 对 某 个 特定 对 象 有 定义 的 定义 空间 谓词 . 举例 说 , 指向 一 个 
数组 的 指针 并 不 包含 信息 来 说 明 对 它 可 以 做 多 少 次 增 量 . 在 一 个 算法 里 使 用 
successor 的 合法 性 必须 由 前 条 件 推导 出 来 . 

下 面 代码 定义 了 与 successor 对 应 的 动作 : 


template<typename I> 
requires(Iterator(I)) 

void increment (I& x) 

‹ 
// WA fF: successor(x) 有 定义 


x = successor(x); 


许多 重要 算法 是 一 遍 的 (single-pass), 如 线性 检索 和 复制 ; 也 就 是 说 , 它们 
仅 将 successor 应 用 到 每 个 迭代 器 的 值 上 一 次 . 这 就 使 它们 可 以 作用 于 输入 
Жї, 这 也 是 我 们 丢掉 对 successor 的 规范 性 要 求 的 原因 : 即使 successor 都 有 定义 ， 
i = j KU Я Ў successor(i) = ѕиссеѕѕог(ј). 进一步 说 , 在 调用 successor(i) 之 后 ， 
i 和 任何 等 于 它 的 迭代 器 都 不 再 是 良 形式 的 了 . 但 它们 仍然 是 部 分 有 效 的 , 可 
以 销毁 它们 或 向 它们 赋值 ; 但 不 能 再 对 它们 使 用 successor. source 和 =. 

TE Ж, successor(i) = successor(j) 并 不 蕴涵 着 i=j. 请 考虑 (例如 ) 两 个 用 空 
指针 结尾 的 单 链表 . 

迭代 器 提供 了 一 种 遍历 整个 数据 集合 的 方法 , 而 且 其 效率 相当 于 在 同样 数 
据 上 遍历 的 任何 其 他 方法 . 
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为 使 一 个 整数 类 型 能 建 模 Iterator, 它 必 须 有 一 个 距离 类 型 . 无 符号 整数 类 
型 是 它 自己 的 距离 类 型 ; 对 于 任何 有 界 二 进 制 整 数 类 型 5, 其 距离 类 型 是 与 之 
对 应 的 无 符号 类 型 Un. 


6.3 范围 
设 f 是 某 个 迭代 器 类 型 的 一 个 对 象 , 而 n 是 与 之 对 应 的 距离 类 型 的 一 个 对 象 ， 
我 们 希望 能 定义 在 从 f 开 始 的 n 个 迭代 器 的 弱 范 围 (weak range) [f, n) 上 的 算 
法 , 采用 下 面 形式 的 代码 
while (!zero(n)) { n = predecessor(n); ... f = successor(f); } 
下 面 性 质 使 我 们 可 以 做 这 种 和 迭代: 
property(! : Iterator) 
weak.range : I x DistanceType(I) 
(f,n) + (Vi € DistanceType(1)) 
(0 < i € n) = successor'(f) 有 定义 


引 理 6.10 < j < i A weak.range(f, i) => weak.range(f, j) 


在 一 个 弱 范 围 里 可 以 前 进 的 步 数 由 它 的 规模 确定 : 


template<typename I> 
requires(Iterator(I)) 
I operator*(I f, DistanceType(I) n) 


€ 
// B f: n > 0 A weak_range(f,n) 
while (!zero(n)) { 
n = predecessor (п); 
f = successor(f); 
} 
return f; 
} 


加 上 下 面 公理 就 能 保证 在 此 范围 里 不 存在 环 路 : 
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property(I : Iterator, N : Integer) 
counted.range : I x N 
(f, n) ++ weak.range(f, n) A 
(Wij EN) (O<i<j<n)> 


successor'(f) Z successor! (f) 


当 f 和 1 是 同一 迭代 器 类 型 的 对 象 时 , 我 们 希望 采用 下 面 形式 的 代码 


while (f != 1) { ... f = successor(f); } 


定义 在 从 f 开始 由 1 界定 的 有 界 范围 (bounded range) [f,1) 上 的 算法 . 


有 界 性 质 使 人 可 以 写 出 这 种 迭代 : 


ргорегіу(ї : Iterator) 
bounded.range : I x I 
(f, 1) + (Эк € DistanceType(1)) counted. range(f, k) ^ successor“ (f) = 1 


这 种 结构 的 迭代 使 用 了 一 个 有 界 范围 , 到 第 一 次 遇 到 ! 时 结束 . 这 样 , 有 界 


范围 就 与 弱 范 围 不 一 样 , 这 里 不 允许 有 环 (cycle). 


对 一 个 有 界 范 围 , 可 以 实现 迭代 上 的 部 分 减法 :3 


template<typename I> 


requires(Iterator(I)) 


DistanceType(I) operator-(I 1, I f) 


£ 


F 


// BI & fF: bounded range(f, 1) 
DistanceType(I) n(0); 
while (f != 1) ( 

n = successor(n); 

f = successor(f); 
F 


return n; 





3. 请 注意 与 第 2 章 的 distance 的 类 似 之 处 . 
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由 于 successor 可 能 不 是 规范 的 , 因此 只 能 在 一 定 的 前 条 件 下 , 或 在 那些 只 
是 要 计算 有 和 界 范围 规模 的 情景 中 使 用 减法 . 

迭代 器 和 整数 之 间 的 + 和 一 的 定义 与 数学 里 的 用 法 不 同 , 因为 数学 里 的 
十 和 一 只 定义 在 同类 型 的 对 象 之 间 . 另 一 方面 , 迭代 器 和 整数 之 间 的 +, 以 及 
迭代 器 之 间 的 — 都 是 基于 successor 归纳 定义 的 , 这 些 又 与 数学 里 一 样 . 自然 数 
上 加 法 的 标准 归纳 定义 基于 函数 successor: 





a+0=a 


а + successor(b) = successor(a + b) 


对 和 迭代 器 的 f+n 的 归纳 定义 与 此 等 价 , 但 所 涉及 的 f 和 nm 具有 不 同类 型 . 一 种 
变形 的 结合 性 也 可 以 通过 归纳 法 证 明 , 这 也 与 自然 数 里 的 情况 类 似 . 


引 理 6.2 (f +n) +m = f + (n + m) 


在 前 条 件 里 需要 描述 范围 的 成 员 关 系 . 我 们 借用 描述 区 间 的 记 法 约定 ( 见 
附录 A), 引进 半 开 的 范围 和 闭 的 范围 . 下 面 用 几 种 稍微 不 同 的 写法 分 别 表示 纶 
范围 、 计 数 范围 和 有 界 范围 . 

一 个 半 开 的 弱 范 围 或 计数 范围 (half-open weak range, half-open counted 
range)[f, n), IEF n > 0 是 整数 , 表示 的 是 迭代 器 序列 {successor*(f)|0 € k < n). 
一 个 闭 的 弱 范 围 或 计数 范围 (closed weak range, closed counted range) [f, п], 其 
中 n>0 是 整数 , 表示 的 是 迭代 器 序列 (successor*(f) |0 < k < n). 

半 开 有 界 范 围 [f,1) 等 价 于 半 开 计数 范围 [f,1 一 作 . 闲 有 界 范围 [f,U 等 价 于 
闭 计 数 范围 [If,1 一 下 . 

一 个 范围 的 规模 (大 小 ) 就 是 它 表 示 的 序列 里 的 迭代 器 个 数 . 

引 理 6.3 对 于 半 开 范围 里 的 每 个 迭代 器 , 以 及 闭 范围 里 除 最 后 一 个 之 外 的 每 个 
和 迭代 器 , successor 都 有 定义 . 


如 果 7 是 范围 而 i 是 迭代 器 ,ie r 表示 i Ж r 的 迭代 器 集合 的 成 员 . 
3138 6.4 如 果 ie [f,1), 那么 [f,i) 和 fi,1) 都 是 有 界 范围 . 


空 的 半 开 范围 (empty half-open range) 用 i, 0) && [i,i) 描述 , HP i 是 某 个 
迭代 器 . 不 存在 空 的 闭 范围 . 


4. 最 早出 现在 Grassmann [1861]; Grassmann 的 定义 由 于 Peano [1908] 而 广为人知 . 
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引 理 6.5 i Z [i,0) ^i g lii) 
引 理 6.6 空 范围 没有 首 元 素 , 也 没有 末 元 素 . 


有 时 也 需要 描述 从 某 个 特定 迭代 器 开始 的 空 序列 . 例如 , 需要 用 二 分 检索 
找到 其 值 都 等 于 某 个 给 定 值 的 迭代 器 序列 . 如 果 不 存在 这 种 值 , 得 到 的 序列 就 
是 空 的 , 但 它 却 有 一 个 位 置 , 如 果 要 做 插入 就 应 该 放 在 这 里 . 

迭代 器 1 称 为 半 开 有 界 范围 [f,1) 的 极限 (limit in a range). BAB f 十 n 是 
半 开 弱 范 围 [f,n) 的 极限 . 注意 , 空 范围 也 有 极限 , 虽然 它 没有 首 元 素 和 末 元 素 . 


引 理 6.7 半 开 弱 范 围 [f,n) 的 规模 是 n. 闭 弱 范围 【f,n] 的 规模 是 mm 二 1. 半 开 有 
界 范围 [f,U 的 规模 是 1 一 f. 闭 有 界 范围 ff, 的 规模 是 (1 一 1) +1. 


如 果 i 和 j 是 一 个 计数 范围 或 有 界 范围 里 的 迭代 器 , 定义 关系 i у 表示 
i j^ bounded range(ij). 也 就 是 说 , 通过 应 用 一 次 或 几 次 successor Ж REJA і 
得 到 ji. 关系 < (“36 T”, precede) 以 及 与 之 对 应 的 自 反 关系 < (“ 先 于 或 等 于 ”， 
precedes or equal) 都 可 以 用 在 规程 里 , 例如 写 在 算法 的 前 条 件 和 后 条 件 里 .< 
对 一 个 迭代 器 类 型 的 很 多 对 值 都 没有 定义 , 因此 通常 不 存在 写 出 实现 < 的 代 
码 的 有 效 方法 . 举例 说 , 不 存在 有 效 方 法 来 确定 在 一 个 链接 结构 里 某 个 结 点 是 
否 先 于 另 一 个 ; 两 个 结 点 也 可 能 根本 就 没有 链接 在 一 起 . 


6.4 THER 


对 一 个 建 模 Readable 和 Iterator 的 类 型 , 属于 该 类 型 的 一 个 迭代 器 范围 称 为 可 
读 的 (readable), 如 果 source 对 该 范围 里 的 所 有 和 迭代 器 都 有 定义 : 


property(1: Readable) 
requires(Iterator(I)) 
readable_bounded_range : I x I 
(f, 1) — bounded.range(f, U) A (Vi € [f,1)) source(i) 有 定义 


请 注意 , source 不 必 对 这 一 范围 的 极限 有 定义 .还 有 , 由 于 在 应 用 了 successor 
之 后 不 能 保证 迭代 器 仍然 是 良好 的 , 因此 , 在 取得 了 一 个 迭代 器 的 后 继 之 后 ， 
不 再 保证 还 能 将 source ФЕН Р Е. 可 以 类 似 地 定义 readable weak range 和 


readable_counted_range . 
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对 一 个 可 读 范围 , 可 以 将 一 个 过 程 应 用 于 该 范围 里 的 每 个 值 : 


template<typename I, typename Proc> 
requires(Readable(I) && Iterator(I) && 
Procedure(Proc) && Arity(Proc) == 1 && 
ValueType(I) == InputType(Proc, 0)) 
Proc for.each(I f, I 1, Proc proc) 


t 
// 前 条 件 : readable bounded. range(f, 1) 
while (f !2 1) ( 
proc(source(f)); 
f = successor(f); 
} 
return proc; 
} 


这 里 返回 使 用 的 过 程 , 因为 它 可 能 已 经 在 遍历 中 积累 了 一 些 有 用 信息 .5 
下 面 过 程 实现 线性 检索 : 


template<typename I> 


requires(Readable(I) && Iterator(I)) 
I find(I f, I 1, const ValueType(I)& x) 


{ 
// ВЕЗЕ: readable bounded range(f, 1) 
while (f != 1 kk source(f) != x) f = successor(f); 
return f; 

小 


这 个 过 程 结束 时 , 或 者 是 它 返 回 的 迭代 器 等 于 范围 的 极限 , 或 者 该 迭代 器 
的 值 等 于 x. 返回 极限 说 明 所 做 的 检索 失败 . 由 于 对 规模 为 n 的 范围 的 检索 有 
n 十 1 种 可 能 结果 , 极限 值 在 这 里 很 有 用 , 许多 其 他 算法 里 也 有 这 种 情况 . ШЖ 
还 需要 用 find MOR, 只 需 对 返回 的 迭代 器 之 后 的 下 一 个 位 置 再 次 调用 它 . 
修改 与 x 的 比较 , 用 相等 而 不 是 不 等 做 判断 , 就 能 得 到 find. not. 


5. 可 以 在 这 里 使 用 函数 对 象 . 
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可 以 把 检索 某 个 值 推广 到 检索 满足 某 个 一 元 谓词 的 第 一 个 值 : 


template<typename I, typename P> 
requires(Readable(I) && Iterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
I find_if(I f, I 1, P p) 


{ 
// BW # fF: readable_bounded_range(f, 1) 
while (f != 1 && !p(source(f))) f = successor(f); 
return f; 

} 


使 用 谓词 本 身 而 不 是 该 谓词 的 补 , 得 到 的 就 是 find if not. 


练习 6.1 请 用 find_if 和 find_if_not 实现 量词 函数 all、none、not_all 和 some, 它们 
都 以 一 个 有 界 范围 和 一 个 谓词 作为 参数 . 


结合 使 用 算法 find 和 量词 函数 , 可 以 检索 满足 某 条 件 的 一 些 值 . 还 可 以 统 
计 这 种 值 的 个 数 : 





template<typename I, typename P, typename J> 
requires(Readable(I) && Iterator(I) && 
UnaryPredicate(P) && Iterator(J) && 
ValueType(I) == Domain(P)) 
J countif(I f, I1, Pp, J j) 
1 
// ВЕЗЕ: readable bounded. range(f, 1) 
while (f != 1) í 
if (p(source(f))) j = successor(j); 
f = successor(f); 
} 


return j; 
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如 果 给 j 加 一 个 整数 需要 线性 时 间 , 那么 就 应 该 明确 地 把 j 作为 一 个 参数 . 
类 型 ] 可 以 是 任何 整数 或 迭代 器 类 型 , 包括 L 


练习 6.2 请 换 一 种 方式 实现 count.if, 其 中 把 一 个 适当 的 函数 对 象 送 给 for-each， 
最 后 从 返回 的 函数 对 象 里 取得 作为 结果 的 值 . 


最 自然 的 默认 方法 是 从 0 开始 计数 , 并 使 用 迭代 器 的 距离 类 型 : 


template<typename I, typename P> 
requires(Readable(I) && Iterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
DistanceType(I) countif(I f, I1, Pp) { 
// 前 条 件 : readable bounded. range(f, 1) 
return count if(f, 1, p, DistanceType(I)(0)); 


把 其 中 的 谓词 换 成 相等 检查 , 就 能 得 到 count; 把 检查 反 过 来 就 可 以 得 到 
count. not 和 count. if. not. 

对 а, MRA IA Toa, 这 种 记 法 可 以 推广 到 很 多 二 元 运算 . B| tn, 
Поа 表示 乘积 , 而 Ajo a, 表示 合 取 . 这 些 例子 里 用 的 运算 都 是 可 结合 的 , 这 
就 意味 着 分 组 并 不 重要 . Kenneth Iverson 在 程序 设计 语言 APL 里 把 这 些 写法 
统一 到 一 个 归 约 运算 符 (reduction operator) /, 它 以 一 个 二 元 运算 和 一 个 序列 
为 参数 , 从 序列 的 元 素 归 约 出 最 后 的 结果 .8 例如 , +/1 2 3 等 于 6. 

Iverson 并 没有 把 归 约 限制 到 可 结合 运算 . 可 以 扩展 Iverson 的 归 约 , 使 之 能 
在 迭代 器 范围 上 工作 , 但 只 限制 到 部 分 可 结合 (partially associative) 运算 , 部 分 
可 结合 是 指 , 如 果 该 运算 在 相 邻 元 素 上 都 有 定义 , 它 就 能 任意 结合 : 





property(Op : BinaryOperation) 
partially associative : Op 
op ++ (Va, b, c € Domain(op)) 
如 果 op(a, b) 和 op(b, c) 有 定义 ， 





6. 见 Iverson [1962]. 
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那么 op(op(a, b), c) 和 op(a, op(b, c))) 也 都 有 定义 且 相 等 . 


作为 部 分 可 结合 但 却 不 是 可 结合 运算 的 例子 , 请 考虑 两 个 范围 [fo,to) 和 
fu) 的 拼接 , 显然 只 有 to — 6 时 它 才 有 定义 . 

这 里 允许 在 执行 二 元 运算 前 将 一 个 一 元 函数 作用 于 每 个 迭代 器 , 由 i 得 到 
at 因为 一 个 任意 的 部 分 可 结合 运算 可 能 没有 单位 元 , 这 里 先 给 出 一 个 归 约 的 
定义 , 它 要 求 参数 是 非 空 范围 : 


template<typename I, typename Op, typename F> 
requires(Iterator(I) && BinaryOperation(Op) && 

UnaryFunction(F) && 

І == Domain(F) && Codomain(F) == Domain(0p)) 
Domain(Op) reduce nonempty(I f, I 1, Op op, F fun) 
1 

// 前 条 件 : bounded. range(f,) Af £1 
// WHE: partially associative(op) 
// 前 条 件 : (Vx € [f 0) fun(x) 有 定义 
Domain(Op) r = fun(f); 
f = successor(f); 
while (f != 1) { 

г = op(r, fun(f)); 

f = successor(f); 
} 


return r; 


fun 最 自然 的 默认 值 是 source. 可 以 给 过 程 传 一 个 单位 元 素 , 用 它 作为 空 范 
围 的 返回 值 : 





template<typename I, typename Op, typename F> 
requires(Iterator(I) && BinaryOperation(Op) && 
UnaryFunction(F) && 
І == Domain(F) && Codomain(F) == Domain(Op)) 
Domain(0p) reduce(I f, I 1, Op op, F fun, const Domain(0p)& z) 
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// 前 条 件 : bounded. range(f, 1) 

// 前 条 件 : partially associative(op) 
// WHE: (Vx € lf, 1) fun(x) 有 定义 
if (f -- 1) return z; 


return reduce nonempty(f, 1, op, fun); 


如 果 涉 及 单位 元 的 运算 比较 慢 , 或 者 是 这 样 的 操作 要 求实 现 另 一 种 求解 逻 
辑 , 下 面 这 个 过 程 可 能 很 有 用 : 


template<typename I, typename Op, typename F> 
requires(Iterator(I) && BinaryOperation(Op) && 
UnaryFunction(F) && 
I == Domain(F) && Codomain(F) == Domain(0p)) 
Domain(Op) reduce.nonzeroes(I f, I 1, 


Ор op, F fun, const Domain(Op)& z) 


// 前 条 件 : bounded гапве(+,1) 
// 前 条 件 : partially associative(op) 
// 前 条 件 : (Wx e [f,W)) fun(x) 有 定义 
Domain(Op) x; 
do { 
if (f == 1) return z; 
x = fun(f); 
f = successor(f); 
} while (x == z); 
while (f != 1) { 
Domain(Op) y = fun(f); 
if (y != z) x = op(x, у); 
f - successor(f); 
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return x; 


对 任何 以 有 界 范 围 为 参数 的 算法 , 都 存在 与 之 对 应 的 以 弱 范 围 或 计数 范围 
为 参数 的 版 本 ; 但 它们 需要 返回 更 多 信息 : 


template<typename I, typename Proc> 
requires(Readable(I) && Iterator(I) && 
Procedure(Proc) && Arity(Proc) == 1 && 
ValueType(I) == InputType(Proc, 0)) 
pair<Proc, I> for.each.n(I f, DistanceType(I) n, Proc proc) 
1 
// WI £ tF: readable weak range(f, n) 
while (!zero(n)) { 
n = predecessor(n); 
proc(source(f)); 
f = successor(f); 
} 


return pair<Proc, I>(proc, f); 


这 里 必须 返回 迭代 器 的 最 终 值 . 因为 没有 要 求 successor 的 规范 性 , 这 就 意 
味 着 不 可 能 简单 地 算出 这 个 最 终 值 . 即使 successor 是 规范 的 , 重新 计算 迭代 器 
也 需要 与 范围 的 规模 成 正比 的 时 间 . 


template<typename I> 
requires(Readable(I) && Iterator(I)) 
pair<I, DistanceType(I)> find n(I f, DistanceType(I) n, 
const ValueType(I)& x) 


// ATÆ fF: readable weak_range(f, n) 
while (!zero(n) && source(f) != x) { 
n = predecessor(n) ; 


f = successor(f) ; 
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} 
return pair<I, DistanceType(I)>(f, n); 


бпа п 返回 迭代 器 的 最 终 值 和 计数 值 , 因为 重新 开始 搜索 需要 用 它们 . 


练习 6.3 请 实现 一 种 算法 变形 , 其 中 使 用 的 find、 量 词 、count 和 reduce 的 版 本 
都 以 弱 范 围 为 参数 , 而 不 是 以 受 限 范围 为 参数 . 


如 果 能 保证 所 给 范围 里 必定 存在 满足 谓词 的 元 素 , 就 可 以 删 去 find if 循环 
里 的 两 个 检测 中 的 一 个 . 这 种 满足 谓词 的 元 素 称 为 哨兵 (sentinel): 


template<typename I, typename P> 
requires(Readable(I) && Iterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
І find_if-unguarded(I f, P p) { 
// 前 条 件 : (30) readable_bounded_range(f, 1) ^ some(f, 1, p) 
while (!p(source(f))) f = successor(f) ; 
return f; 


// АЕ: p(source(f)) 


如 果 应 用 该 谓词 本 身 而 不 是 其 否定 , 就 得 到 find if. not unguarded. 
给 定 了 两 个 具有 相同 值 类 型 的 范围 和 该 值 类 型 上 的 一 个 关系 , 可 以 检索 不 
匹配 的 值 对 : 


template<typename IO, typename I1, typename R> 
requires(Readable(IO) && Iterator(IO) && 
Readable(I1) && Iterator(I1) && Relation(R) && 
ValueType(IO) == ValueType(I1) && 
ValueType(IO) == Domain(R)) 
pairXIO, I1» find mismatch(IO #0, IO 10, I1 fi, I1 11, R r) 
t 
// 前 条 件 : readable bounded_range(f0,10) 
// 前 条 件 : readable_bounded_range(f1, 11) 
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while (fO != 10 && fl != 11 && r(source(f0), source(f1))) { 
£0 = successor (#0); 
fl = successor (£1); 
} 
return pair<I0, 11>(£0, f1); 
> 


练习 6.4 请 给 出 find mismatch 的 后 条 件 , 并 解释 为 什么 两 个 迭代 器 的 最 终 值 会 
是 这 种 情况 . 


适合 用 在 find_mismatch 里 的 最 自然 的 默认 关系 是 值 类 型 上 的 相等 关系 . 
练习 6.5 请 为 限界 范围 和 弱 范 围 的 四 种 组 合 设计 find mismatch 的 各 种 变形 . 


有 时 需要 做 的 不 是 在 两 个 范围 里 找到 不 匹配 的 元 素 , 而 是 在 一 个 范围 里 找 
不 匹配 的 相 邻 元 素 : 


template<typename I, typename R> 
requires(Readable(I) && Iterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
I find_adjacent_mismatch(I f, I 1, R r) 
1 





// ВЕЗЕ: readable bounded.range(f, 1) 

if (f == 1) return 1; 

ValueType(I) x = source(f); 

f 7 successor(f); 

while (f != 1 && r(x, source(f))) { 
x = source(f) ; 
f = successor(f) ; 

} 


return f; 


如 前 所 述 , 在 对 一 个 迭代 器 使 用 了 successor 之 后 , 就 不 能 再 对 它 应 用 
source. 因此 这 里 必须 拷贝 它 以 前 的 值 . 对 Iterator 的 弱 要 求 也 意味 着 , WRR 
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到 不 匹配 的 对 之 后 返回 第 一 个 迭代 器 , 实际 返回 的 可 能 不 是 一 个 良 形式 的 值 . 


6.5 递增 的 范围 


给 定 了 某 种 类 型 的 迭代 器 的 值 类 型 上 的 一 个 关系 , 该 迭代 器 类 型 的 一 个 范围 
称 为 是 对 它 保 关系 的 (relation preserving), 如 果 该 关系 对 这 一 范围 里 所 有 的 相 
邻 值 都 成 立 . 换 句 话说 , 如 果 在 这 一 范围 和 关系 下 调用 find adjacent. mismatch, 
返回 的 将 是 范围 的 极限 : 




















template<typename I, typename R> 
requires(Readable(I) && Iterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
bool relation preserving(I f, I 1, R r) 
t 
// lil # ЁЁ: readable bounded range(f, 1) 
return 1 == find adjacent mismatch(f, 1, r); 


给 定 了 一 个 弱 序 +, 如 果 一 个 范围 对 的 逆 的 补 是 保 关 系 的 , 那么 就 说 这 一 
范围 是 7T- 递 增 的 (increasing range). 给 定 弱 关系 r, 如 果 一 个 范围 对 于 т 是 保 关 
系 的 , 则 称 这 一 范围 是 严格 T- 递 增 的 (strictly increasing range). 很 容易 为 严格 
递增 范围 实现 一 个 检测 : 


template<typename I, typename R> 





requires(Readable(I) && Iterator(I) && 
Relation(R) && ValueType(I) -- Domain(R)) 
bool strictly.increasing.range(I f, I 1, R r) 
1 
// 前 条 件 : readable bounded. range(f, 1) Л weak_ordering(r) 
return relation preserving(f, 1, r); 


可 以 借助 于 函数 对 象 实现 一 个 递增 范围 的 检测 : 
7. 也 有 些 作者 使 用 术语 非 递减 和 递增 , 而 不 是 递增 和 严格 递增 . 
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template<typename R> 
requires(Relation(R)) 
struct complement of converse 
t 
typedef Domain(R) T; 
Bx} 
complement_of_converse(const R& r) : r(r) { } 
bool operator()(const T& a, const T& b) 
1 


return !r(b, a); 


н 


template<typename I, typename R> 
requires(Readable(I) && Iterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
bool increasing range(I f, I l, R r) 


1 
// 前 条 件 : readable bounded. range(f, 1) A weak_ordering(r) 
return relation preserving( 
f, 1, 
complement -of converse«R»(r)); 
1 


strictly increasing. counted. range 和 increasing_counted_range 的 定义 直截了当 . 

给 定 某 和 迭代 器 类 型 的 值 类 型 上 的 谓词 p, 如 果 在 该 迭代 器 类 型 的 一 个 范围 
E, 所 有 满足 该 谓词 的 值 都 在 此 范围 里 所 有 不 满足 该 谓词 的 值 之 后 , 就 称 这 一 
范围 是 p- 划 分 的 (p-partitioned range). 很 容易 写 出 一 个 能 检查 作为 参数 的 范围 
是 否 p- 划 分 的 过 程 : 


template<typename I, typename P> 
requires(Readable(I) && Iterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
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bool partitioned(I f, I 1, P p) 
1 
// Bí & ЇР: readable bounded range(f, 1) 
return 1 == find if not (find if(f, 1, p), l, p); 


调用 find.if 返回 的 迭代 器 称 为 划分 点 (partition point). 它 是 相关 的 值 能 满 
足 这 一 谓词 的 第 一 个 迭代 器 (如 果 存 在 ). 
练习 6.6 请 实现 谓词 partitionedn, 它 检测 一 个 计数 范围 是 否 为 p- 划 分 的 . 

线性 检索 需要 在 每 次 应 用 successor 之 后 调用 source, 因为 失败 的 检测 不 能 


为 这 一 范围 里 的 任何 迭代 器 的 值 提供 信息 . 当然 , 划分 范围 的 规范 性 给 了 我 们 
更 多 的 信息 . 


引 理 6.8 WR p 是 一 个 谓词 , [f,1) 是 一 个 p- 划 分 的 范围 , 那么: 
(Vm € [{,1)) 7p(source(m)) = (Vj € If, т]) —p(source(;)) 
(Vm € [f, 0) p(source(m)) = (Vj € (т, 1)) p(source(j)) 
这 说 明了 一 个 找到 划分 点 的 二 分 段 算法 : 如 果 数 据 是 一 致 分 布 的 , 检测 范 


围 的 中 点 能 把 检索 空间 缩小 一 半 . 当然 , 这 个 算法 可 能 需要 去 遍历 已 经 遍历 过 
的 子 范围 . 避免 这 一 问题 就 要 求 successor 的 规范 性 . 


6.6 前 向 迭代 器 
如 果 successor 是 规范 的 , 算法 里 就 可 以 多 次 穿 过 同一 个 范围 , 也 可 以 在 同一 范 
围 里 维持 多 个 迭代 器 


ForwardIterator(T) 全 
Iterator(T) 


A regular. unary. function (successor) 


注意 , Iterator 和 Forwardlterator 之 间 就 差 一 条 公理 , 而 且 这 里 没 增加 新 运 
Ж. 除了 successor, 本 章 后 面 要 介绍 的 定义 在 前 向 迭代 器 的 精 化 上 的 其 他 功能 
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性 过 程 也 都 是 规范 的 . successor 的 规范 性 使 得 在 find adjacent mismatch 的 实现 
里 向 前 推进 时 可 以 不 必 保 存 原 值 : 


template<typename I, typename R> 
requires(Readable(I) && ForwardIterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
I find.adjacent mismatch forward(I f, I 1, R r) 
1 
// ВТЗ fF: readable bounded range(f, 1) 
if (f == 1) return 1; 
It; 
do 1 
t=f; 
f = successor(f); 
} while (f != 1 && r(source(t), source(f))); 


return f; 


注意 , t 指向 不 匹配 的 元 素 对 的 第 一 个 元 素 , 可 以 返回 它 . 

在 第 10 章 里 , 我 们 将 展示 如 何 利 用 概念 分 发 (concept dispatch) 为 另 一 不 
同 的 迭代 器 概念 写 一 个 重 载 的 算法 版 本 . forward 的 后 缀 可 以 帮助 消除 不 同 
版 本 之 间 的 歧义 . 

successor 的 规范 性 也 使 得 可 以 为 检索 划分 点 实现 一 个 二 分 段 算法 : 


template<typename I, typename P> 
requires(Readable(I) && ForwardIterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
I partition.point n(I f, DistanceType(I) n, P p) 
1 
// 前 条 件 : readable counted range(f, n) A partitioned n(f, n, p) 
while (!zero(n)) { 
DistanceType(I) h - half nonnegative(n); 
Im=f+h; 


Download at hti: // wer pinSi.com, 


110 第 6 章 迭代 器 


if (p(source(m))) { 


n = h; 
} else { 
п = п - successor(h); f = successor (m) ; 
} 
} 
return f; 


引 理 6.9 partition_point_n 返回 范围 【fn 的 p- 划 分 点 . 
要 在 一 个 有 界 范 围 里 用 二 分 段 法 找 划分 点 ,8 先 要 得 到 范围 的 规模 : 


template<typename I, typename P> 
requires(Readable(I) && ForwardIterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
I partition_point(I f, I 1, P p) 
1 
// 前 条 件 : readable bounded. range(f, 1) A partitioned(f, l, p) 


return partition point n(f, 1 - f, p); 


根据 划分 点 的 定义 , 立刻 可 以 得 到 在 弱 序 + 的 一 个 + 递增 范围 里 的 二 分 检 
AWK 任意 值 а, 无 论 其 是 否 出 现在 该 递增 范围 里 , 都 在 这 种 范围 里 确定 了 两 
个 迭代 器 , 分 别称 为 下 界 (lower bound) 和 上 界 (upper bound). 非 形式 地 说 , F 
界 是 使 等 价 于 a 的 值 可 能 出 现在 递增 序列 里 的 第 一 个 位 置 . 与 之 对 应 , 上 界 在 
递增 范围 里 可 能 出 现 等 价 于 а 值 的 最 后 一 个 位 置 的 后 继 (successor). 这 样 , 等 
HF а 的 元 素 只 能 出 现在 从 下 界 到 上 界 的 一 个 半 开 范围 里 . 看 一 个 例子 , 假定 





8. 二 分 段 技术 (bisection technique) 至 少 可 以 追溯 到 中 值 定 理 的 证 明 Bolzano [1817], 以 及 与 
之 独立 的 Cauchy [1821]. 在 Bolzano 和 Cauchy 用 这 种 技术 处 理 连续 函数 的 最 一 般 情 况 之 前 ， 
Lagrange [1795] 早已 用 它 去 解决 多 项 式 求 近似 根 的 特殊 问题 了 . 在 检索 方面 有 关 二 分 段 法 的 
描述 最 先 由 John W. Mauchly 在 其 讲稿 “排序 和 核对 " 中 给 出 [Mauchly 1946]. 
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现在 是 全 序 , 相对 于 值 a 的 具有 下 界 Е u 的 元 素 具 有 下 面 的 情况 : 


XOs Xl; .XI 一 1) XU -Xu 一 1) Хаз Xu+15 ++ 9 Xn—-1 
LEE eS eee 
xi<a ма «>а 


注意 , 这 三 个 范围 都 可 以 是 空 的 . 
引 理 6.10 在 递增 范围 [f,1) E, 对 该 范围 的 值 类 型 里 的 任意 值 a, 下 面 两 个 谓词 
都 划分 这 一 范围 : 


lower-bound, (x) = —r(x, a) 


upper. bound, (x) <> r(a, x) 


这 就 使 我 们 可 以 将 下 界 和 上 界 形式 化 地 定义 为 相应 谓词 的 划分 点 . 
引 理 6.11 下 界 和 迭代 器 先 于 或 等 于 上 界 和 迭代 器 . 


如 果 有 一 个 对 应 于 所 考虑 的 谓词 的 函数 对 象 , 立刻 就 可 以 得 到 下 面 的 确定 
下 界 的 算法 : 


template<typename R> 
requires (Relation(R) ) 


struct lower bound predicate 


1 
typedef Domain(R) T; 
const T& a; 
R r; 
lower.bound predicate(const T& а, R г) : a(a), r(r) { } 
bool operator()(const T& x) ( return !r(x, a); ) 
); 


template<typename I, typename R> 
requires(Readable(I) && ForwardIterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
I lower_bound n(I f, DistanceType(I) n, 
const ValueType(I)& a, R r) 
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// ВГ ЗЕЕ: weak_ordering(r) A increasing-counted_range(f, n, т) 
lower_bound_predicate<R> p(a, r); 


return partition point n(f,'n, р); 


上 界 的 处 理 与 此 类 似 : 
template<typename R> 
requires (Relation(R)) 


struct upper.bound predicate 


k: 
typedef Domain(R) T; 
const T& a; 
Rr; 
upper bound predicate(const T& a, Rr) : a(a), r(r) { } 
bool operator() (const T& x) { return r(a, x); } 
н 


template<typename I, typename R> 
requires(Readable(I) && ForwardIterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
I upper.bound n(I f, DistanceType(I) n, 
const ValueType(I)& a, R r) 


t 
// 前 条 件 : weak_ordering(r) A increasing-counted-range(f, n, r) 
upper bound predicate<R> p(a, r); 
return partition point.n(f, n, p); 

} 


练习 6.7 请 实现 一 个 过 程 同 时 返回 下 界 和 上 界 , 而 且 其 中 比较 的 次 数 应 少 于 分 
别 独 立 调 用 lower_bound_n 和 upper.bound. n 时 的 比较 次 数 之 和 .3 





9. 一 个 具有 类 似 功能 的 STL 函数 称 为 equal-range. 
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在 划分 点 算法 里 把 谓词 应 用 到 范围 的 中 点 , 可 以 保证 谓词 应 用 次 数 的 最 坏 
情况 达到 最 优 . 对 任何 其 他 选择 , 都 可 以 设想 一 种 情况 打败 它 . 为 此 只 需 保证 
更 大 的 子 范围 包含 划分 点 就 可 以 了 . 如 果 存 在 对 划分 点 预期 位 置 的 先 验 知识 ， 
当然 可 以 直接 去 检查 那个 点 . 

partition. point.n 里 使 用 谓词 [logo n] + 1 次 , 因为 每 步 都 使 范围 的 长 度 除了 
2. 这 一 算法 只 需要 执行 对 数 次 的 迭代 器 和 整数 之 间 的 加 法 . 


引 理 6.12 对 于 前 向 迭代 器 , 这 一 算法 执行 successor 运算 的 总 次 数 小 于 等 于 范 
围 的 规模 . 


partition. point 还 要 计算 1 一 f. 对 于 前 向 迭代 器 , 它 还 需要 加 上 对 successor 
的 mn 次 调用 . 如 果 应 用 谓词 的 代价 比 调 用 successor 的 代价 更 高 , 那 就 值得 对 前 
向 迭代 器 做 这 一 操作 , 例如 对 链接 表 . 


引 理 6.13 假设 划分 点 的 期 望 距离 等 于 范围 的 规模 的 一 半 , 要 用 前 向 迭代 器 找 
到 划分 点 , partition_point 将 比 find if. 更 快 一 些 


log;n 
COStsuccessor < 人 = 2t) COSt predicate 


бт KIRKE 


为 使 partition. point, lower. bound 和 upper bound 能 主导 线性 检索 的 代价 , 就 必须 
保证 给 和 迭代 器 加 一 个 整数 , 以 及 做 两 个 迭代 器 的 减法 操作 都 非常 快 : 


IndezedIterator(T) 全 
Forwardlterator(T) 
^ +:Tx DistanceType(T) — T 
A —:Tx Т DistanceType(T) 
A 十 用 常量 时 间 
A 一 用 常量 时 间 





在 Iterator 上 定义 运算 + 和 一 的 基础 是 successor. 现在 应 该 把 它们 作为 
原 语 , 而 且 要 高 效 : 这 一 概念 与 Foruardlterator 的 差异 只 是 更 强 的 复杂 性 要 求 ; 
3H RSDERS ЕШ + 和 — 的 代价 本 质 上 与 successor 一 样 . 
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6.8 ”双向 迭代 器 
也 有 些 情 况 中 虽然 不 能 直接 索引 , 但 却 有 反 向 移动 的 能 力 : 
BidirectionalIterator(T) 全 
ForwardIterator(T) 
人 predecessor : T— T 
人 predecessor 用 常量 时 间 
A (Wi € T) successor(i) 有 定义 之 
predecessor(successor(i)) Ж Ж Х В. ж i 
A (Vi € T) predecessor(i) 有 定义 之 
successor(predecessor(i)) 有 定义 且 等 于 i 
与 successor — Ë, predecessor 也 不 必 是 全 的 ; 这 个 概念 的 公理 将 其 定义 与 
successor 的 定义 相关 联 . 我 们 期 望 predecessor 的 代价 在 本 质 上 等 于 successor 的 
代价 . 
引 理 6.14 如 果 successor 在 双向 迭代 器 i 和 j 上 有 定义 , 那么 
successor(i) = successor(j) = i =j 
在 一 个 双向 迭代 器 的 弱 范围 里 , 可 以 反 向 移动 近代 器 直到 范围 的 开始 : 
template<typename I> 
requires (Bidirectionallterator(I)) 


I operator-(I 1, DistanceType(I) n) 


1 
// BI A fF: n > 0 A (3f € I) weak.range(f, n) AL=f+n 
while (!zero(n)) { 
n = predecessor(n); 
1 = predecessor(1); 
} 
return 1; 
} 


对 双向 迭代 器 可 以 做 反 向 检索 . 正如 在 前 面 已 经 注意 到 的 , 检索 一 个 包含 
n 个 迭代 器 的 范围 时 有 m+1I 个 可 能 结果 ; 前 向 或 反 向 检索 都 是 如 此 . 因此 我 们 
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约定 用 (f, U 表示 左边 半 开 的 范围 , 用 f 表示 “ 没 找到 ”. 这 样 做 时 , ROMER 
代 器 i 处 找到 满足 要 求 的 值 时 返回 successor(i): 


template<typename I, typename P> 
requires(Readable(I) && Bidirectionallterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
I find.backward if(I f, I 1, P p) 
1 
// 前 条 件 : (f | # — = ERE F ü Bl 
while (1 != f && !p(source(predecessor(1)))) 
1 = predecessor(1); 


return 1; 


将 这 一 算法 与 fnd-if 比较 , 说 明了 一 种 程序 变换 : f 和 1 扮演 着 互 换 的 角色 ， 
source(i) 变 成 了 source(predecessor(i)), 而 且 successor(i) 变 成 predecessor(i). 在 这 
一 变换 下 , 在 非 空 范围 里 1 可 以 间接 访问 , 但 + 却 不 行 . 

上 面 展示 的 程序 变换 可 用 于 任何 使 用 前 向 迭代 器 的 范围 的 算法 . 这 也 说 
明 有 可 能 实现 一 个 适配器 类 型 , 给 它 一 个 双向 迭代 器 类 型 , 它 生 成 另 一 个 双向 
迭代 器 类 型 , 使 其 中 的 successor AE FR predecessor, predecessor 变 成 successor, Н. 
source 变 成 predecessor 的 source.” 利用 这 一 适配器 类 型 , 任何 基于 和 迭代 器 或 前 
向 迭代 器 的 算法 都 可 以 在 双向 迭代 器 上 反 向 工作 , 它 还 能 让 定义 在 双向 迭代 
器 上 的 任何 算法 调换 遍历 的 方向 . 


练习 6.8 HF find backward if, 在 循环 里 只 调用 predecessor 一 次 . 


练习 6.9 作为 同时 用 successor 和 predecessor 的 算法 实例 , 请 实现 一 个 谓词 确定 
一 个 范围 是 否 为 回 文 , 也 就 是 从 前 向 后 读 和 从 后 向 前 读 都 一 样 的 一 段 文字 . 


69 随机 访问 和 迭代 器 


有 些 和 迭代 器 类 型 同时 满足 索引 迭代 器 和 双向 和 迭代 器 的 需求 . 这 类 和 迭代 器 称 为 
随机 访问 迭代 器 (random access iterator), 提供 计算 机 寻 址 的 全 部 功能 : 


10.4E STL 里 称 它 为 翻转 迭代 器 适配器 . 
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RandomAccessIterator(T) 全 
IndezedIterator(T) A Bidirectionallterator(T) 
^. TotallyOrdered(T) 
^(vijeTi«jei-j 
A DifferenceType : RandomAccessIterator — Integer 
入 十 :Tx DifferenceType(T) — Т 
А 一 :Tx DifferenceType(T) — T 
А —:Tx T— DifferenceType(T) 
^ < 用 常量 时 间 
A 在 和 迭代 器 和 整数 之 间 的 一 运算 用 常量 时 间 


类 型 DifferenceType(1) 应 足够 大 , 足以 包含 所 有 距离 和 它们 的 加 法 道 , 如 果 
+ 和 j 是 来 自 一 个 合法 范围 的 迭代 器 , i 一 j 总 有 定义 . 同样 可 以 给 迭代 器 加 上 一 
个 负数 , 或 者 减 去 一 个 负数 . 

对 于 弱 一 点 的 迭代 器 类 型 , + 和 一 运算 只 在 一 个 范围 里 有 定义 . 对 随机 访 
f] 3 98, 除了 对 十 和 一 外 , 这 一 事实 对 < 也 成 立 . 一 般 而 言 , 两 个 迭代 器 之 
间 的 运算 只 在 它们 同属 于 一 个 范围 时 有 定义 ， 


项 目 6.1 请 为 随机 访问 迭代 器 之 间 的 运算 定义 与 之 有 关 的 公理 . 
由 于 有 下 面 事 实 , 我 们 不 需要 花 很 多 时 间 去 讨论 随机 选择 迭代 器 ， 


定理 6.1 对 任何 定义 在 显 式 地 给 出 的 随机 访问 迭代 器 范围 上 的 过 程 , 都 存在 另 
一 个 定义 在 索引 和 迭代 器 上 的 过 程 与 之 复杂 性 相同 . 


证 明 , 由 于 随机 访问 迭代 器 上 的 运算 仅 在 迭代 器 属于 同一 范围 时 有 定义 , 因此 
我 们 可 能 实现 一 个 适配器 类 型 , 给 它 一 个 索引 迭代 器 类 型 , 它 生成 一 个 随机 访 
问 迭 代 器 类 型 . 这 种 迭代 器 的 状态 包含 一 个 迭代 器 f 和 一 个 整数 i, 表示 和 迭代 
器 f+i 各 种 迭代 器 运算 , 例如 +. — 和 <, ME i 上 运算 ; source YE f + ¿ 上 运 
Ж. 换 句 话说 , 就 是 一 个 迭代 器 指向 范围 的 开始 , 还 有 一 个 到 范围 内 部 的 索引 ， 
其 行为 等 同 于 随机 访问 迭代 器 . 口 


这 一 定理 说 明 , 上 述 两 个 概念 在 已 知 范围 的 起 点 的 情况 下 , 在 任意 的 上 下 
文中 都 是 理论 上 等 价 的 . 在 实践 中 , 我 们 也 发 现 采 用 稍 弱 的 那个 概念 也 不 会 使 
性 能 恶化 . 然而 , 在 一 些 情况 中 , 相关 的 签名 需要 调整 , 需要 加 进 范 围 的 起 始点 . 
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图 6.1 迭代 器 概念 的 结构 


GA 6.2 请 为 在 一 个 范围 里 查找 子 序列 实现 一 组 抽象 过 程 . 说 明 选 择 适当 算 
EW RUN & Fh A EAL @r.11 


6.10 总 结 


代数 提供 了 许多 概念 , 它们 具有 很 好 的 分 层 结构 , 如 半 群 、 模 和 群 . 这 些 概念 
使 我 们 可 以 在 更 广义 的 上 下 文中 陈述 各 种 算法 . 与 此 类 似 , 迭代 器 概念 (图 6.1) 
也 使 我 们 可 以 在 最 广义 的 上 下 文 里 陈述 顺序 数据 结构 上 的 算法 . 这 些 概念 的 
开发 用 到 了 三 种 精 化 : 增加 一 个 运算 , 或 者 增强 语义 , 或 者 是 提出 一 个 更 强 的 
复杂 性 需求 . 特别 是 这 里 的 三 个 重要 概念 : RAB. W 03k A KIRK 
35. 它们 之 间 的 差异 不 仅 在 于 与 之 关联 的 各 种 运算 , 还 在 于 它们 的 语义 和 复杂 
性 . 针对 不 同 选 代 器 概念 的 各 种 各 样 的 检索 算法 , 计数 的 和 有 界 的 范围 , 以 及 
范围 的 序 , 共同 构成 了 顺序 程序 设计 的 基础 . 





11. 本 问题 的 两 个 广为人知 的 算法 是 Boyer and Moore [1977] 和 Knuth et al. [1977]. Musser and 
Nishanov [1997] 可 以 作为 这 些 算法 的 抽象 描 述 的 很 好 的 基础 . 
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A 

第 вж#лит- накаже, 它们 可 以 用 作 算法 与 不 变 的 线性 形状 的 
对 象 之 间 的 接口 . 本 章 将 超越 选 代 器 继续 前 进 , 讨论 处 理 更 复杂 的 形状 的 一 些 
坐标 结构 . 这 里 将 介绍 二 又 坐标 , 并 借助 一 个 完成 先 代 式 树 启 历 的 机 器 实现 一 
些 二 丸 树 上 的 算法 .在 讨论 了 坐标 结构 的 概念 模式 之 后 最 后 提出 一 些 与 同 
构 、 等 价 和 有 序 相关 的 算法 . 


7.1 二 又 坐标 


XE ANS AE PR TY: n] UR Fo ETE GE, 其 中 每 个 位 置 只 有 一 个 后 继 . 也 存在 一 些 可 
能 有 任意 多 个 后 继 的 数据 结构 . 本 章 将 研究 一 类 重要 结构 , 其 中 每 个 位 置 恰好 
有 两 个 后 继 , 而 且 分 别 标明 是 左 后 继 或 者 右 后 继 . 为 了 定义 这 种 结构 上 的 算法 ， 
首先 定义 下 面 的 概念 : 


BifurcateCoordinate(T) 2 
Regular(T) 
^ WeightType : BifurcateCoordinate -> Integer 
^ empty : T — bool 
人 has.left. successor : T — bool 
A has.right.successor : T — bool 
A left.successor : T — Т 
A right.successor : T — T 


^ (Vi, j € T) (left.successor(i) = j V right.successor(i) = j) = —emptyG) 


Download at hti: // ww pinSi.com, 


120 987 € 坐标 结构 


这 里 的 WeightType 类 型 函数 返回 一 个 类 型 , 它 足以 用 于 在 通过 二 又 坐标 
(bifurcate coordinate) 遍历 的 过 程 中 为 历经 的 所 有 对 象 计数 . 类 型 WeightType 
类 似 于 迭代 器 类 型 的 DistanceType. 


这 里 的 谓词 empty 处 处 有 定义 . 如 果 它 返回 真 , 那么 其 他 过 程 都 无 定 
Ж. empty 是 由 has left successor 和 has right successor 决定 的 定义 空间 谓词 的 否 
定 ，has_left_successor 是 left successor 的 定义 空间 谓词 , 而 has right successor 是 
right_successor 的 定义 空间 谓词 . 换 一 个 说 法 , 如 果 一 个 二 叉 坐 标 不 空 , 那么 
has_left_successor 和 has_right_successor 就 都 有 定义 ; 如 果 这 两 者 中 的 某 个 返回 真 ， 
与 之 对 应 的 后 继 函 数 就 有 定义 . 针对 迭代 器 的 算法 需要 有 一 个 限界 值 或 计数 
值 标明 范围 的 结束 . 而 对 于 二 叉 结构 , 由 于 存在 着 很 多 分 支 结束 的 位 置 , 因此 
引入 谓词 has_left_successor 和 has right.successor 来 确定 坐标 结构 是 否 有 后 继 就 
非常 自然 了 . 


下 面 要 描述 BifurcateCoordinate 概念 上 的 一 些 算法 , 其 中 的 所 有 运算 都 是 
规范 的 , 这 与 Iterator 概念 的 情况 有 所 不 同 . 出 现 这 种 情况 , 是 因为 使 用 Iterator 
的 一 些 最 基本 算法 都 不 要 求 successor 的 规范 性 , 例如 find. 而 且 那 里 也 确实 有 
一 些 非 规范 模型 , 例如 输入 流 . 对 那些 应 用 了 left_successor 和 right_successor 可 
能 改变 基础 二 叉 树 形状 的 结构 , 我 们 需要 一 个 WeakBifurcateCoordinate (88 = 
X bs) 概念 , 其 中 运算 不 是 规范 的 . 


对 前 面 讨论 的 弱 范 围 , 通过 迭代 器 访问 的 结构 可 能 是 循环 的 ; 而 对 于 计数 
范围 或 有 界 范围 , 其 形状 一 定 是 个 线性 片段 . 与 之 对 应 , 为 了 讨论 通过 二 又 坐 
标 结构 访问 的 结构 的 形状 , 需要 有 可 达 性 (reachability) 的 概念 . 


二 叉 坐 标 4 是 另 一 坐标 结构 x BJ А. 6 (proper descendant), 如 果 它 是 x 
的 左 后 继 或 右 后 继 , 或 者 它 是 x 的 左 后 继 或 右 后继 的 后 代 . 二 叉 坐 标 结构 y 是 
坐标 结构 x 的 后 代 (descendant), ШЖ. y = x, RÆ y 是 x 的 真 后 代 . 


WR x 的 任何 后 代 y 都 不 是 它 自身 的 后 代 , 那么 x 的 所 有 后 代 就 形成 一 个 
有 向 无 环 图 (directed acyclic graph, DAG). 换 句 话说 , 要 求 任意 坐标 的 后 继 链 不 
会 回 到 它 自身 . 在 这 种 情况 下 , x 称 为 它 的 后 继 DAG 的 根 (root). 如 果 x 的 后 
继 形 成 一 个 DAG 而 且 其 后 继 的 数目 有 穷 , 它们 就 构成 了 一 个 有 穷 DAG. AH 
DAG 的 高 度 (height) 是 从 它 的 根 出 发 的 最 长 后 继 序列 的 长 度 加 一 . 如 果 DAG 
为 空 , 其 高 度 就 是 0. 
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如 果 二 叉 坐 标 结构 y 是 x 的 左 后 继 的 后 代 , 就 说 它 从 x 左 可 达 (left 
reachable), 右 可 达 (right reachable) 可 以 类 似 地 定义 . 

如 果 x 的 后 代 形 成 一 个 有 穷 DAG, 而 且 对 x 的 后 代 中 任意 的 y 和 z, 从 y 
都 不 能 同时 左 可 达 并 且 右 可 达 z, 那么 x 的 后 代 就 形成 了 一 棵 树 (tree). RAE 
i, 这 要 求 从 一 个 坐标 到 它 的 任意 后 代 只 有 唯一 的 一 条 后 继 序 列 . 树 的 这 一 性 
质 在 本 章 的 算法 中 所 起 的 作用 , 就 像 有 界 范 围 或 计数 范围 的 各 种 性 质 在 第 6 Ж 
的 作用 . 这 个 性 质保 证 了 有 穷 终止 性 : 


property(C : BifurcateCoordinate) 
tree: С 


x x fla f HB — ЖИ 
存在 计算 树 的 权重 (weight, B0) 和 高 度 的 递归 算法 : 


template<typename C> 
requires(BifurcateCoordinate(C)) 
WeightType(C) weight recursive(C c) 
t 
// 前 条 件 : tree(c) 
typedef WeightType(C) N; 
if (empty(c)) return N(0); 
N 1(0; 
N r(0); 
if (has.left successor(c)) 
1 = weight. recursive(left successor(c)); 
if (has right successor(c)) 
г = weight recursive(right successor(c)); 
return successor(1 + r); 


1 


template<typename C> 

requires(BifurcateCoordinate(C)) 
WeightType(C) height recursive(C c) 
t 


Download at htip: //werw pinsi.com, 


122 第 7 章 坐标 结构 


// WH fib: tree(c) 
typedef WeightType(C) N; 
if (empty(c)) return N(0); 
N 1(0; 
N r(0; 
if (has left successor(c)) 
1 = height recursive(left successor(c)); 
if (has right successor(c)) 
r 7 height.recursive(right successor(c)); 
return successor(max(l, r)); 


y 


8| #2 7.1 height-recursive(x) < weight.recursive(x) 


height. recursive 也 能 正确 计算 DAG 的 高 度 , 但 可 能 多 次 访问 一 些 坐 标 , 访问 
一 个 坐标 的 次 数 等 于 到 该 坐标 的 路 径 总 数 . 这 一 事实 也 意味 着 weight_recursive 
不 能 正确 计算 出 DAG 的 权重 . 遍历 DAG 和 有 环 结构 的 算法 都 需要 做 标记 
(marking), 也 就 是 说 , 需要 采用 某 种 记录 各 坐标 是 否 已 经 访问 的 方法 . 

深度 优先 的 树 遍 历 存 在 三 种 基本 顺序 . 这 三 种 方法 都 是 在 完全 遍历 了 左 后 
代 之 后 再 去 遍历 右 后 代 . 前 序 (preorder) 方式 在 遍历 一 个 坐标 的 所 有 后 代 之 前 
访问 这 个 坐标 ; Ф А (inorder) 方式 在 遍历 左 后 代 和 右 后 代 之 间 访 问 该 坐标 ; 后 
序 (postorder) 方式 在 遍历 了 所 有 后 代 之 后 访问 该 坐标 . 我 们 用 下 面 的 类 型 定 
义 为 这 三 种 遍历 命名 : 


enum visit { pre, in, post }; 


可 以 在 一 个 过 程 里 执行 上 述 三 种 遍历 的 任意 组 合 , 为 此 只 需 让 该 过 程 以 另 
一 个 过 程 为 参数 , 由 它 完 成 对 坐标 的 访问 : 


template<typename C, typename Proc> 
requires(BifurcateCoordinate(C) && 
Procedure(Proc) && Arity(Proc) == 2 && 
visit == InputType(Proc, 0) && 
== InputType(Proc, 1)) 
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Proc traverse nonempty(C c, Proc proc) 
t 
// 前 条 件 : tree(c) Л —empty(c) 
proc(pre, c); 
if (has left successor(c)) 
proc = traverse .nonempty(left successor(c), proc); 
proc(in, c); 
if (has right successor(c)) 
proc = traverse nonempty(right successor(c), proc); 
proc(post, c); 


return proc; 


T2 ”双向 二 又 坐标 


递归 遍历 (recursive traversal) 需要 使 用 与 树 的 高 度 成 正比 的 栈 空间 ， 这 种 空间 
可 能 大 到 等 于 树 中 的 元 素 个 数 ; 对 于 很 大 而 且 非 平衡 的 树 , 这 种 空间 规模 通常 
无 法 让 人 接受 . 还 有 , traverse_nonempty 的 接口 不 允许 对 多 棵 树 的 并 发 遍历 . 一 
般 而 言 , 在 并 发 地 人 遍历 多 棵 树 时 , 需要 为 每 棵 树 使 用 一 个 栈 . 如 果 把 一 个 坐标 和 
以 前 经 过 的 坐标 的 栈 组 合 起 来 , 就 能 得 到 一 种 新 的 坐标 类 型 , 可 以 通过 多 做 一 
次 变换 来 获得 前 驱 . (用 动作 而 不 是 变换 可 能 更 高 效 , 因为 可 以 避免 每 次 拷贝 
整个 栈 .) 这 种 坐标 建 模 了 双向 二 又 坐标 (bidirectional bifurcate coordinate) 的 概 
S. 这 一 概念 有 一 个 更 简单 也 更 灵活 的 模型 : 让 树 里 的 每 个 结 点 包含 一 个 前 驱 
链接 . 这 样 的 树 就 能 支持 并 发 的 只 需 常量 空间 的 遍历 , 也 能 支持 各 种 重新 平衡 
的 算法 . 因此 多 用 一 个 额外 链接 的 开销 还 是 合算 的 . 


BidirectionalBifurcateCoordinate(T) 全 
BifurcateCoordinate(T) 
A has.predecessor : T — bool 
A (Vi € T) cempty(i) = has.predecessor(i) 有 定义 
A predecessor : T — T 
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A (Vi € T) has_left_successor(i) => 
predecessor(left_successor(i)) # MAF i 
^ (Vi € T) has.right. successor(i) => 
predecessor(right successor(i)) 有 定义 且 等 于 i 
A (Wi € Т) has_predecessor(i) => 
is_left_successor(i) V is.right.successor(i) 


其 中 的 is left successor 和 is. right successor 定义 如 下 : 


template<typename T> 
requires (BidirectionalBifurcateCoordinate(T)) 
bool is.left successor(T j) 


1 

// Bi & fF: has. predecessor(;) 

T i = predecessor(j); 

return has left successor(i) && left successor(i) == j; 
} 


template<typename T> 
requires(BidirectionalBifurcateCoordinate(T)) 


bool is.right successor(T j) 


{ 

// ATÆ fF: has_predecessor(j) 

T i - predecessor(j); 

return has.right successor(i) && right successor(i) == j; 
} 


引 理 7.2 如 果 x My 是 双向 二 叉 华 标 ， 


left_successor(x) = left_successor(y) => x = u 
left. successor(x) = right.successor(y) => x = y 


right successor(x) = right. successor(y) + x = у 
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练习 7.1 存在 坐标 x 使 
is_left_successor(x) 人 is_right_successor(x) 
这 一 事实 与 双向 二 叉 坐 标的 公理 矛盾 吗 ? 


无 论 一 个 坐标 是 否 有 后 继 , traverse nonempty 都 访问 它 三 次 ; 维持 这 一 不 变 
式 使 遍历 过 程 具有 一 种 统一 性 . 还 有 , 对 一 个 坐标 的 三 次 访问 总 按 同样 顺序 出 
BR, (pre, in, post), 因此 , 给 定 了 当前 坐标 和 刚 对 它 执行 的 访问 , 只 要 有 该 坐标 及 
其 前 驱 的 信息 , 就 能 确定 下 一 个 坐标 和 下 一 个 状态 了 . 根据 这 些 认 识 可 以 得 到 
一 个 遍历 带 有 双向 二 叉 坐 标的 树 的 迭代 式 算法 , 它 只 需要 用 常量 的 空间 . 这 种 
遍历 依赖 于 一 部 机 器 (machine), 也 就 是 说 , 一 段 可 以 被 许多 算法 作为 部 件 使 用 
的 语句 序列 : 


template<typename C> 
requires(BidirectionalBifurcateCoordinate(C)) 
int traverse.step(visit& v, C& c) 
t 
// 前 条 件 : has_predecessor(c) V v # post 
switch (v) { 
case pre: 
if (hasleft_successor(c)) í 
C = left.successor(c); return 1; 
} v= іц; return 0; 
case in: 
if (hasright_successor(c)) { 
v = pre; c = right_successor(c); return 1; 
} v= post; return 0; 
case post: 
if (is_left_successor(c)) 
v = in; 


с = predecessor(c); return -1; 
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上 面 过 程 的 返回 值 表明 了 高 度 的 变化 . 基于 traverse step 的 算法 应 该 用 一 
个 循环 , 直至 最 后 一 次 (对 post 的 ) 访问 到 达 最 初 的 坐标 时 循环 终止: 


template<typename C> 
requires (BidirectionalBifurcateCoordinate(C)) 
bool reachable(C x, C y) 
1 
// WH: tree(x) 
if (empty(x)) return false; 
C root = x; 
visit v = pre; 
do { 
if (x == y) return true; 
traverse_step(v, x); 
} while (x != root || у != post); 
return false; 


+ 


S| EE 7.3 如 果 reachable 返回 , 返回 之 前 v = pre. 
要 计算 树 的 权重 , 只 需 统 计 遍 历 中 pre 访问 的 次 数 : 


template<typename C> 
requires (BidirectionalBifurcateCoordinate(C) ) 
WeightType(C) weight(C c) 
t 
// 前 条 件 : tree(c) 
typedef WeightType(C) N; 
if (empty(c)) return N(0); 
C root = c; 
visit v = pre; 
N n(1); // FÆR: п 是 至 此 访问 pre 的 次 数 
do { 


traverse_step(v, c); 
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if (v == pre) n = successor(n); 
} while (c != root || v != post); 
return n; 


} 


练习 7.2 请 修改 weight, 让 它 统计 in 或 post 访问 的 次 数 , 而 不 是 统计 pre. 


要 计算 树 的 高 度 , 算法 里 需要 维护 当前 高 度 和 经 历 过 的 最 大 值 : 


template<typename C> 
requires(BidirectionalBifurcateCoordinate(C)) 
WeightType(C) height(C c) 
{ 
// 前 条 件 : tree(c) 
typedef WeightType(C) N; 
if (empty(c)) return N(0); 
C root = c; 
visit v = pre; 
N n(2); // 不 变 式 : п 是 至 此 pre 访问 中 的 最 大 高 度 
N n(1); // FÆR: m 是 当前 pre 访问 的 高 度 
do { 
m = (m - N(1)) + N(traverse step(v, с) + 1); 
n = max(n, m); 


) while (c != root || v != post); 
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return n; 
Z 

额外 的 -1 和 +1 是 因为 WeightType 是 无 符号 整数 . 可 以 利用 max 的 累积 
版 本 来 帮助 改善 这 段 代 码 . 


可 以 定义 一 个 对 应 于 traverse-nonempty HERRIE. 这 里 包含 了 一 个 空 


树 检查 , 因为 不 需要 在 每 次 递归 调用 时 做 这 种 检查 : 


template<typename C, typename Proc> 


requires (BidirectionalBifurcateCoordinate(C) && 
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Procedure(Proc) && Arity(Proc) == 2 && 
visit == InputType(Proc, 0) && 
C == InputType(Proc, 1)) 
Proc traverse(C c, Proc proc) 
1 
// 前 条 件 : tree(c) 
if (empty(c)) return proc; 
C root = c; 
visit v = pre; 
proc(pre, c); 
do { 
traverse_step(v, c); 
proc(v, c); 
) while (c != root || v != post); 
return proc; 


} 


练习 7.3 利用 traverse step 和 第 2 章 的 过 程 , 确定 一 个 双向 二 叉 坐 标的 后 代 是 
否 构 成 一 个 DAG. 


迭代 器 的 readable bounded.range 性 质 说 明了 source 对 一 个 范围 里 的 每 个 
迭代 器 都 有 定义 . 对 二 叉 坐 标的 类 似 性 质 是 
property(C : Readable) 
requires(BifurcateCoordinate(C)) 
readable_tree : C 
x > tree(x) A (Vy € C) reachable(x, у) => source(y) 有 定义 


要 想 扩 展 迭 代 器 算法 (例如 find 和 count) 使 之 能 用 于 二 又 坐标 , 存在 两 种 
可 能 的 方式 : 或 是 实现 一 个 专用 版 本 , 或 是 实现 一 个 适配器 类 型 . 


项 目 7.1 请 实现 第 6 章 的 各 种 算法 的 双向 二 又 坐标 版 本 . 


项 目 7.2 请 设计 一 个 适配器 类 型 , 给 它 一 个 双向 二 叉 坐 标 类 型 , 它 能 生成 一 个 
迭代 器 类 型 , 该 类 型 能 按照 构造 迭代 器 时 指定 的 遍历 顺序 (pre. in BR post) 访 
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问 有 关 的 坐标 . 


7.3 坐标 结构 


至 此 我 们 已 经 定义 了 一 些 孤 立 的 概念 , 针对 每 个 概念 给 出 了 一 组 过 程 及 其 语 
义 规 程 . 定义 一 种 概念 模式 (concept schema) 有 时 也 很 有 意义 . 概念 模式 描述 
一 族 概念 的 某 些 共同 性 质 . 通常 不 大 可 能 定义 能 用 于 概念 模式 的 算法 , 但 是 对 
同属 一 个 概念 模式 的 不 同 概念 , 还 是 有 可 能 描述 与 之 相关 的 算法 的 结构 . 例如 ， 
前 面 定 义 了 一 些 描述 线性 遍历 的 迭代 器 概念 , 以 及 一 些 描述 二 叉 树 遍历 的 二 
叉 坐 标 概念 . 为 能 在 任意 的 数据 结构 里 遍历 , 现在 引进 一 种 称 为 坐标 结构 的 概 
念 模式 . 一 个 坐标 结构 可 能 有 若干 个 相互 关联 的 坐标 类 型 , 每 个 类 型 有 不 同 的 
遍历 函数 . 坐标 结构 的 概念 抽象 了 数据 结构 中 与 漫游 有 关 的 方面 , 这 里 考虑 的 
数据 结构 就 是 将 在 第 12 章 介绍 的 组 合 结构 ; 它 还 抽象 了 存储 管理 和 拥有 关系 . 
完全 可 以 有 多 种 坐标 结构 描述 着 同一 集 对 象 . 

一 个 特定 的 概念 是 一 种 坐标 结构 (coordinate structure), 如 果 它 由 一 个 或 
几 个 坐标 类 型 , 0 个 或 几 个 值 类 型 , 一 个 或 几 个 遍历 函数 , 0 个 或 几 个 访问 函数 
组 成 . 其 中 每 个 遍历 函数 把 一 个 或 几 个 坐标 类 型 和 (或 ) 值 类 型 映射 到 一 个 坐 
标 类 型 , 每 个 访问 函数 把 一 个 或 几 个 坐标 类 型 和 (或 ) 值 类 型 映射 到 一 个 值 类 
78. 例如 , 作为 一 种 坐标 结构 , 一 个 可 读 索 引 和 迭代 器 有 一 个 值 类 型 和 两 个 坐标 
类 型 , 即 该 和 迭代 器 类 型 本 身 及 其 距离 类 型 . 遍历 函数 是 + (给 一 个 迭代 器 加 上 
一 个 距离 ) 和 一 (给 出 两 个 迭代 器 的 距离 ). 还 有 一 个 访问 函数 source. 


та AH, Ft tea Ж 


同一 坐标 结构 概念 的 两 组 坐标 称 为 是 同 构 的 (isomorphic)， 如 果 它 们 具有 同样 
的 形状 . 更 严格 地 说 , 两 组 坐标 同 构 的 条 件 是 存在 它们 之 间 的 一 个 一 一 对 应 , 使 
来 自 第 一 组 中 的 一 个 遍历 函数 对 坐标 的 任何 合法 应 用 返回 的 坐标 , 对 应 于 同 
一 个 遍历 函数 作用 于 来 自 第 二 组 里 的 那个 对 应 坐标 得 到 的 结果 . 

检查 同 构 的 算法 只 使 用 遍历 函数 , 因此 同 构 与 被 坐标 指向 的 对 象 的 值 无 
关 . 但 同 构 要 求 同 样 的 访问 函数 在 对 应 的 一 对 坐标 上 或 者 都 有 定义 , 或 者 都 无 
定义 . 例如 , 两 个 有 界 或 计数 范围 同 构 的 条 件 是 它们 的 规模 相同 . 前 向 迭代 器 的 
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两 个 弱 范 围 同 构 的 条 件 是 它们 具有 同样 的 轨道 结构 (有 关 轨 道 结构 的 定义 见 
第 2 章 ). 两 棵 树 同 构 的 条 件 是 或 者 它们 都 为 空 ; 或 者 它们 都 不 空 时 被 下 面 代码 
判断 为 同 构 : 


template<typename CO, typename C1> 
requires(BifurcateCoordinate(CO) && 
BifurcateCoordinate(C1)) 


bool bifurcate.isomorphic nonempty(CO cO, C1 c1) 


$ 
// Bl # PE: tree(c0) A tree(c1) A —empty(c0) A —етрїу(с1) 
if (has_left_successor(c0)) 
if (has left successor(c1)) { 
if (!bifurcate_isomorphic nonempty( 
left.successor(c0), left successor(ci))) 
return false; 
) else return false; 
else if (has left successor(ci)) return false; 
if (has.right successor(cO)) 
if (has.right.successor(ci)) { 
if (!bifurcate isomorphic.nonempty( 
right.successor(c0), right successor(ci))) 
return false; 
) else return false; 
else if (has right successor(c1)) return false; 
return true; 
J 


引 理 т.а 对 双向 二 又 坐标 , 树 同 构 的 条 件 是 同时 遍历 得 到 相同 的 访问 序列 ; 


template<typename CO, typename C1> 
requires (BidirectionalBifurcateCoordinate(CO) && 
BidirectionalBifurcateCoordinate(C1)) 


bool bifurcate.isomorphic(CO cO, Ci ci) 
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// 前 条 件 : tree(c0) ^ tree(cl) 

if (empty(cO)) return empty(ci); 

if (empty(ci)) return false; 

CO rootO = c0; 

visit vO = pre; 

visit vl = pre; 

while (true) { 
traverse_step(v0, cO); 
traverse_step(vi, c1); 
if (vO != v1) return false; 


if (cO == root0 && vO == post) return true; 


第 6 章 里 有 一 些 有 关 线性 和 二 分 段 式 检索 的 算法 , 它们 分 别 依赖 于 相等 和 
全 序 , 而 相等 和 全 序 又 都 与 规范 性 概念 有 关 . 在 归纳 出 了 取 自 一 种 坐标 结构 的 
坐标 集合 上 的 相等 和 有 序 概念 之 后 , 我 们 就 可 以 去 检索 对 象 的 集合 , 而 不 仅仅 
是 检索 个 别 的 对 象 了 . 

来 自 同一 可 读 坐 标 结构 概念 , 并 且 具 有 同样 值 类 型 的 两 集 坐 标 称 为 是 按 某 
给 定 等 价 关 系 (针对 一 个 值 类 型 有 一 个 等 价 关系 ) 等 价 (equivalent), 如 果 它 们 
同 构 , 而 且 将 同一 访问 函数 应 用 于 这 两 个 集合 里 的 对 应 坐标 , 将 返回 等 价 的 两 
AMA. 将 等 价 关 系 换 成 值 类 型 的 相等 , 就 得 到 坐标 集合 相等 的 一 个 自然 定义 . 

两 个 可 读 有 界 范围 等 价 的 条 件 是 它们 的 规模 相同 , 而 且 对 应 的 迭代 器 具有 
相互 等 价 的 值 : 


template<typename 10, typename 11, typename R> 
requires(Readable(IO) && Iterator(IO) && 
Readable(I1) && Iterator(I1) && 
ValueType(IO) == ValueType(I1) && 
Relation(R) && ValueType(IO) == Domain(R)) 
bool lexicographical equivalent(IO fO, IO 10, Ii fi, I1 11, R r) 
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// ATÆ fF: readable bounded range(f0, 10) 

// BI & fF: readable_bounded_range(f1, 11) 

// WHE: equivalence(r) 

pairXIO, I1» р = find mismatch(fO, 10, fi, 11, r); 
return p.mO == 10 && p.mi == 11 


很 容易 实现 一 个 lexicographical.equal, 为 此 只 需 把 一 个 实现 了 值 相等 关系 
的 函数 对 象 传 给 lexicographical equivalent: 


template<typename T> 


requires(Regular(T)) 
struct equal 
t 
bool operator()(const T& x, const T& y) 
{ 
return x == y; 
$ 
NN 


template<typename IO, typename I1» 
requires(Readable(IO) && Iterator(IO) && 
Readable(I1) && Iterator(I1) && 
ValueType(I0) == ValueType(11)) 
bool lexicographical.equal(IO fO, IO 10, I1 fi, I1 11) 
4 
return lexicographical_equivalent(f0, 10, fl, 11, 
equal«ValueType(I0)» ) ; 


两 棵 可 读 树 等 价 的 条 件 是 它们 同 构 , 并 且 相 互 对 应 的 坐标 具有 相同 的 值 ; 


template<typename CO, typename Ci, typename R> 
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requires(Readable(CO) && BifurcateCoordinate(CO) && 
Readable(C1) && BifurcateCoordinate(Ci) && 
ValueType(CO) == ValueType(Ci) && 
Relation(R) && ValueType(CO) == Domain(R)) 
bool bifurcate.equivalent nonempty(CO cO, C1 ci, R r) 
t 
// WH tF: readable_tree(c0) A readable_tree(c1) 
// BI # fF: —empty(c0) A —empty(c1) 
// BI # FE: equivalence(r) 
if (!r(source(c0), source(c1))) return false; 
if (has left successor(c0)) 
if (has left successor(ci)) 4 
if (!bifurcate equivalent nonempty( 
left successor(cO), left successor(ci), r)) 
return false; 
) else return false; 
else if (has left successor(ci)) return false; 
if (has right.successor(cO)) 
if (has right successor(ci)) { 
if (!bifurcate equivalent nonempty( 
right successor(cO), right successor(ci), r)) 
return false; 
) else return false; 
else if (has.right successor(ci)) return false; 


return true; 


对 于 双向 二 又 坐 标 , 两 棵 树 等 价 的 条 件 是 同时 访问 得 到 的 是 同样 的 访问 序 
列 , 而 且 对 应 的 坐标 具有 等 价 的 值 : 


template<typename CO, typename C1, typename R> 
requires(Readable(CO) && 
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BidirectionalBifurcateCoordinate(CO) && 
Readable(C1) && 
BidirectionalBifurcateCoordinate(C1) && 
ValueType(CO) == ValueType(C1) && 
Relation(R) && ValueType(CO) == Domain(R)) 
bool bifurcate_equivalent(CO cO, Ci ci, R г) 
t 

// ВТЗ ЕЕ: readable_tree(c0) A readable tree(c1) 

// WEE: equivalence(r) 

if (empty(cO)) return empty(c1); 

if (empty(ci)) return false; 

CO root0 = c0; 

visit vO = pre; 

visit vi = pre; 

while (true) { 
if (vO == pre && !r(source(cO), source(ci))) 

return false; 

traverse_step(v0, c0); 
traverse.step(vi, c1); 
if (vO != vi) return false; 


if (cO == rootO && vO == post) return true; 


可 以 用 字典 序 的 方式 将 弱 序 (REF) 扩展 到 迭代 器 的 可 读 范围 上 . 这 样 
做 时 可 忽略 等 价 (或 相等 ) BO RU A, 并 认为 更 短 的 范围 先 于 更 长 的 范围 : 


template<typename 10, typename 11, typename R> 
requires(Readable(IO) && Iterator(IO) && 
Readable(I1) && Iterator(I1) && 
ValueType(IO) == ValueType(I1) && 
Relation(R) && ValueType(I0) == Domain(R)) 
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bool lexicographical_compare(I0 #0, IO 10, Ii f1, I1 11, R r) 
t 
// 前 条 件 : readable.bounded. range(f0, 10) 
// ATÆ fF: readable_bounded_range(f1, 11) 
// 前 条 件 : weak_ordering(r) 
while (true) { 
if (#1 == 11) return false; 
if (fO == 10) return true; 
if (r(source(f0), source(f1))) return true; 
if (r(source(f1), source(f0))) return false; 
£0 = successor(f0); 


fl = successor (f1); 


上 述 函数 可 以 直截了当 地 专门 化 为 lexicographical less, 为 此 只 需要 为 r 传 
一 个 表达 了 值 类 型 上 的 < 关系 的 函数 对 象 : 


template<typename T> 
requires(TotallyOrdered(T)) 
struct less 


i 
bool operator()(const T& x, const T& y) 
1 
return x < y; 
} 
3; 


template<typename 10, typename I1> 
requires(Readable(IO) && Iterator(IO) && 
Readable(I1) && Iterator(I1) && 
ValueType(IO) == ValueType(11)) 
bool lexicographical less(IO #0, IO 10, Ii f1, 11 11) 
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return lexicographical_compare(f0, 10, fi, 11, 
less<ValueType(I0)>()); 
} 


练习 7.4 请 解释 , 为 什么 在 lexicographical compare 里 第 三 个 和 第 四 个 if 语句 可 
以 交换 位 置 , 但 第 一 个 和 第 二 个 不 能 . 


练习 7.5 请 解释 为 什么 我 们 不 用 find_mismatch 实现 lexicographical_compare. 


还 可 以 将 字典 序 扩展 到 二 叉 坐 标 结构 , 此 时 应 该 忽略 等 价 的 有 根子 树 , 并 
认为 一 个 没有 左 后 继 的 坐标 先 于 有 左 后 继 的 坐标 . 如 果 根 据 当前 值 和 左 子 树 
不 能 确定 结果 , 就 认为 没有 右 后 继 的 坐标 先 于 有 右 后 继 的 坐标 . 


练习 7.6 请 为 可 读 二 叉 坐 标 实现 bifurcate.compare.nonempty. 


完成 了 上 面 练 习 的 读者 , 一 定 会 赞赏 下 面 这 个 算法 的 简洁 性 , 它 基于 双向 
坐标 , 采用 和 迭代 式 遍历 的 方式 比较 两 棵 树 : 


template<typename CO, typename C1, typename R> 
requires(Readable(CO) && 
BidirectionalBifurcateCoordinate(CO) && 
Readable(Ci) && 
BidirectionalBifurcateCoordinate(C1) && 
Relation(R) && ValueType(CO) == Domain(R)) 
bool bifurcate.compare(CO cO, Ci сі, R г) 
t 
// 前 条 件 : readable tree(c0) A readable tree(c1) A weak.ordering(v) 
if (empty(ci)) return false; 
if (empty(cO)) return true; 
СО rootO = c0; 
visit vO = pre; 
visit vi = pre; 
while (true) { 
if (vO == pre) { 
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if (r(source(c0) source(ci))) return true; 
if (r(source(ci), source(cO))) return false; 
} 
traverse_step(v0, c0); 
traverse step(vi, ci); 
if (vO != v1) return vO > v1; 


if (cO == root0 && vO == post) return false; 


还 可 以 送 给 bifurcate compare 一 个 永远 失败 的 关系 , 以 这 种 方式 来 实 
现 bifurcate_shape-compare， 这 将 使 我 们 可 以 对 一 批 树 进行 排序 , 因而 可 以 用 
upper-bound 在 对 数 时 间 里 找到 其 中 同 构 的 树 . 


项 目 7.3 请 为 一 族 数据 结构 设计 一 种 坐标 结构 , 并 将 同 构 、 等 价 和 序 的 概念 扩 
展 到 这 种 坐标 结构 . 


7.5 总 结 


线性 结构 在 计算 机 科学 里 扮演 着 基础 的 角色 , 迭代 器 为 这 种 结构 和 在 其 上 工 
作 的 算法 提供 了 自然 的 接口 . 然而 , 也 存在 一 些 非 线 性 结构 , 它们 有 自己 的 非 
线性 的 坐标 结构 . 双向 二 叉 坐 标 让 我 们 看 到 了 一 种 迭代 式 算法 , 有 关 情 况 与 在 
迭代 器 范围 上 的 算法 大 不 相同 . 我 们 还 把 同 构 、 相 等 和 序 的 概念 扩展 到 了 具 
有 不 同 拓扑 结构 的 坐标 集合 上 . 
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pu—— EMA BBE, 即 针对 特定 的 坐 
标 修 改 successor 或 遍历 函数 . 重 链 接 使 我 们 可 以 实现 各 种 重新 安排 (例如 排 
JE), 并 保持 各 坐标 原来 的 source 值 . 这 里 要 介绍 一 些 重 链接 机 器 , 它们 能 保持 
坐标 的 特定 结构 性 质 . 本 章 最 后 将 总 结 出 一 种 机 器 , 它 使 我 们 能 完成 某 种 特定 
的 树 遍 历 , 其 中 既 不 需要 栈 , 也 不 需要 前 驱 链 接 , 而 是 在 遍历 中 临时 性 地 重 链接 
一 些 坐 标 . 


8.1 链接 和 迭代 器 


在 第 6 章 里 , 我 们 把 具体 迭代 器 的 successor 都 看 成 不 变 的 , 因此 , 将 successor 应 
用 于 特定 的 迭代 器 总 返回 同一 个 值 . 8 48 sk KB (linked iterator) 类 型 是 一 种 前 
向 迭代 器 类 型 , 对 它 存在 着 一 种 链接 对 象 (linker object). 将 这 种 链接 对 象 作用 
于 一 个 迭代 器 可 以 改变 该 迭代 器 的 successor 关系 . 链接 表 建 模 这 种 迭代 器 , BE 
接 表 里 结 点 之 间 的 关系 可 以 改变 . 这 里 将 使 用 链接 对 象 , 而 不 是 在 迭代 器 上 重 
载 的 set. successor 过 程 , 这 样 就 能 允许 同一 数据 结构 的 不 同 链接 . 举例 说 , 双向 
链表 可 以 通过 同时 设置 后 继 和 前 驱 链接 , 也 可 以 只 设置 后 继 链接 . 这 就 使 一 个 
多 遍 算 法 可 以 在 做 最 后 一 遍 工作 之 前 不 维护 前 驱 关 系 , 从 而 尽 可 能 地 减少 工 
作 量 . 通过 这 种 方式 , 我 们 实际 上 是 借助 于 相应 的 链接 对 象 , 间接 地 描述 了 链 
接 选 代 器 的 概念 . 在 下 面 非 形式 的 讨论 时 , 还 是 会 说 链接 和 迭代 器 类 型 . 为 定义 
链接 对 象 的 需求 , 需要 定义 下 面 几 个 与 之 相关 的 概念 : 





ForwardLinker(S) 全 
lteratorType : ForwardLinker 一 ForwardlIterator 


Download at http: // wer pinsi.com, 


140 第 8 章 后 继 可 变 的 坐标 


А + 1 = IteratorType(S): 
(Vs € S) (s : I x I — void) 
^ (Vs € S) (Vi,j € I) 如 果 successor(i) 有 定义 ， 
则 s(i,j) 建立 起 successor(i) =j 


BackwardLinker(S) 全 
IteratorType : BackwardLinker 一 Bidirectionallterator 
A 4 1 = IteratorType(S): 
(Vs € S) (s : I x I void) 
A (Vs € 5) (Vi,j € I) 如 果 predecessor(j) 有 定义 ， 
ДІ s(i,j) 建立 起 i = predecessor(j) 


BidirectionalLinker(S) & ForwardLinker(S) ^ BackwardLinker(S) 
如 果 两 个 范围 不 包含 公共 的 迭代 器 , 就 说 它们 不 相交 (disjoint). 对 于 半 开 
的 限界 范围 , 这 一 情况 对 应 于 : 


property(! : Iterator) 
disjoint: Ix IX Ix I 
(f0, 10, £1, 11) + (Vi € 1) “(i € [f0,10) A í € [£1,11)) 


另外 两 类 范围 的 情况 都 与 此 类 似 . 由 于 链接 迭代 器 也 是 迭代 器 , 因此 也 遵循 我 
们 为 范围 定义 的 各 种 概念 . 但 是 , 对 于 链接 和 迭代 器 , 范围 的 不 相交 和 其 他 性 质 
都 可 能 随 着 时 间 的 变化 而 改变 . 完全 可 能 有 这 种 情况 , 只 有 一 个 前 向 链接 的 前 
向 迭代 器 ( 单 链表 ) 的 若干 互 不 相交 的 范围 共享 同一 个 极限 , 通常 称 为 nil. 


82 链接 重 整 


一 个 链接 重 整 (link rearrangement) 是 一 个 算法 , 它 以 一 个 或 多 个 链接 范围 为 参 
数 , 返回 一 个 或 多 个 链接 范围 , 并 满足 如 下 性 质 . 


。 不同 输入 范围 (无 论 计数 的 还 是 限界 的 ) 两 两 不 相交 . 
。 不 同 输出 范围 (无 论 计数 的 还 是 限界 的 ) 两 两 不 相交 . 
。 每 一 个 输入 范围 里 的 每 个 迭代 器 都 出 现在 某 一 个 输出 范围 里 面 . 


Download at ht: // www pinSi.com, 


82 链接 重 整 141 


。 每 一 个 输出 范围 里 的 每 个 迭代 器 都 出 现在 某 一 个 输入 范围 里 面 . 


。 任 何 输出 范围 里 的 任 一 迭代 器 所 指 的 对 象 都 与 重 整 之 前 一 样 , 而 且 该 对 
象 的 值 也 没有 改变 . 


还 请 注意 , 在 输入 范围 里 成 立 的 successor 和 predecessor 关系 , 在 输出 范围 
里 未 必 还 成 立 . 

一 个 链接 重 整 保持 先 于 关系 (precedence preserving), 如 果 在 任 一 输出 范围 
里 的 来 自 同 一 个 输入 范围 的 两 个 迭代 器 有 i < j, 那么 关系 1 <j 在 原 输 入 范围 
里 也 一 定 成 立 . 

要 实现 一 个 链接 重 整 , 需要 很 小 心地 满足 上 面 提 出 的 不 相交 性 、 保 持 性 和 
FRA. 下 面 我 们 将 首先 展示 三 个 很 短 的 过 程 (或 说 是 机 器 ), 其 中 每 个 都 执行 
一 步 遍历 或 者 链接 . 而 后 从 这 些 机 器 出 发 组 合 出 各 种 链接 重 整 , 完成 链接 范围 
的 划分 、 组 合 和 翻转 . 前 两 个 机 器 的 功能 是 建立 或 维持 通过 引用 传 来 的 两 个 
和 迭代 器 之 间 的 关系 = successor(t): 








template<typename I> 
requires (ForwardIterator(I)) 
void advance_tail(Iz t, Ik f) 


t 
// 前 条 件 : successor(f) 有 定义 
t = £f; 
f = successor(f); 

} 


template<typename S> 
requires (ForwardLinker(S)) 
struct linker to.tail 
1 
typedef IteratorType(S) I; 
S set. link; 
linker to tail(const S& set link) : set link(set link) ( ) 
void operator()(I& t, Ik f) 
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// BI & fF: successor(f) 有 定义 
set link(t, f); 
advance_tail(t, f); 


J 
可 以 用 advance tail 找到 非 空 限 界 范围 里 的 最 后 一 个 迭代 器 :1 


template<typename I> 
requires(ForwardIterator(I)) 
I findlast(I f, I 1) 
{ 
// ВЕЗЕ: bounded.range(f, 1) Af AL 
It; 
do 
advance.tail(t, f); 
while (f != 1); 


return t; 


可 以 结合 使 用 advance tail 和 linker.to.tail, 根据 将 一 个 伪 谓 词 (pseudo pred- 
icate) 应 用 到 范围 里 的 各 个 迭代 器 上 的 结果 , 把 该 范围 分 划 为 两 个 范围 . 伪 谓 
词 不 必 是 规范 的 , 其 结果 可 以 依赖 于 它 的 自身 状态 或 者 输入 . 举例 说 , 一 个 伪 
谓词 可 以 忽略 其 参数 而 简单 地 交替 返回 假 和 真 . 本 算法 有 三 个 参数 : 一 个 链接 
迭代 器 的 限界 范围 , 一 个 定义 在 链接 和 迭代 器 类 型 上 的 伪 谓 词 , 还 有 一 个 链接 对 
象 . 算法 返回 一 对 范围 , 它们 分 别 包含 了 不 满足 伪 谓 词 的 那些 迭代 器 和 满足 它 
的 那些 迭代 器 . 把 这 样 返回 的 范围 表达 为 闭 限 界 范围 hil 更 加 方便 , 这 里 的 h. 
是 第 一 个 (或 称 为 头 , head) 迭代 器 , 而 t 是 最 后 一 个 (MAW A, tail) 迭代 器 . 返 
回 每 个 范围 的 尾 , 使 调用 者 可 以 重新 链接 起 迭代 器 , 而 不 必 再 做 一 次 遍历 去 找 
到 它 (不 必用 例如 find last). 当然 , 返回 的 两 个 范围 都 可 能 为 空 , 这 里 通过 返回 
h=t=1 表 示 , 其 中 的 1 是 输入 范围 的 极限 . 本 算法 不 修改 返回 的 两 个 范围 里 


1. 应 该 看 到 , 第 6 章 里 的 find adjacent mismatch. forward 隐 含 地 使 用 了 advance.tail. 
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的 尾 和 迭代 器 的 successor. 下 面 是 这 一 算法 : 


template<typename I, typename S, typename Pred> 
requires(ForwardLinker(S) && I == IteratorType(S) && 
UnaryPseudoPredicate(Pred) && I == Domain(Pred)) 
pair< pair<I, I>, pair<I, I> > 
split_linked(I f, I 1, Pred p, S set link) 


1 
// Wii & ff: bounded. range(f, 1) 
typedef pair<I, I> P; 
linker_to_tail<S> link to tail(set link); 
I hO = 1; I tO = 1; 
I hi = 1; 1+1=1; 
if (f == 1) goto s4; 
if (p(f)) { hi = f; advance.tail(ti, f); goto si; } 
else { hO = f; advance.tail(tO, f); goto s0; } 
80: if (f == 1) goto s4; 
if (p(f)) { hi = f; advance.tail(ti, f); goto s3; } 
else t advance.tail(tO, f); goto s0; } 
si: if (f == 1) goto s4; 
if (p(f)) { advance.tail(ti, f); goto si; } 
else { hO = f; advance.tail(tO, f); goto s2; ) 
s2: if (f == 1) goto s4; 
if (p(f)) { link to.tail(ti, f); goto s3; } 
else 1 advance.tail(tO, f); goto s2; ) 
83: if (f == 1) goto s4; 
if (p(f) { advance tail(ti, f); goto 83; Y 
else 1 link.to.tail(tO, f); goto s2; } 


S4: return pair<P, P»(P(hO, t0), P(h1, +1)); 
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这 个 过 程 也 是 一 个 状态 机 . 其 中 的 变量 t ЯП +1 分 别 指向 两 个 输出 范围 的 
Ж. 机 器 的 状态 对 应 于 下 面 几 个 条 件 : , 


50: successor(t0) = f A —p(t0) 

sl: successor(t1) = f A p(t1) 

52: successor(t0) = f A —p(t0) A p(t1) 
53: successor(t1) = f A —p(t0) A p(t1) 


只 有 在 状态 s2 和 53 之 间 转 换 时 才 需 要 重新 链接 . 在 上 面 算 法 里 , 即使 某 
状态 的 下 一 状态 紧 随 其 后 , 也 写 了 goto 语句 , 这 样 做 只 是 为 了 看 起 来 对 称 . 


引 理 8.1 对 于 split linked 返回 的 每 个 (n, d, MA һ=1е=1. 


练习 8.1 假定 split linked 返回 的 一 个 范围 (ht) 不 空 , 请 解释 c 指向 哪里 ， 
successor(t) 的 值 是 什么 . 


引 理 8.2 split linked 是 一 个 保持 先 于 关系 的 链接 重 整 . 


通过 将 一 个 伪 关 系 作 用 到 两 个 输入 范围 的 剩余 部 分 的 头 , 可 以 利用 
advance.tail 和 linker_to.tail 实现 一 个 算法 把 两 个 范围 合 而 为 一 . 伪 关 系 (pseudo 
relation) 就 是 同 源 的 二 元 伪 谓 词 , 不 必 是 规范 的 . 这 个 算法 有 四 个 参数 : 两 个 链 
接 迭 代 器 的 范围 , 一 个 定义 在 相应 迭代 器 类 型 上 的 伪 关 系 , 以 及 一 个 链接 对 象 . 
算法 返回 一 个 三 元 组 (6,60, 其 中 [f,1) 是 组 合 起 来 的 迭代 器 的 一 个 半 开 范围 ， 
te [f,1) 是 最 后 访问 的 迭代 器 . 随后 调用 find last(t, U) 将 返回 该 范围 里 的 最 后 一 
个 迭代 器 , 使 得 到 的 范围 可 以 链接 另 一 个 范围 . 下 面 是 这 个 算法 : 


template<typename I, typename S, typename R> 
requires(ForwardLinker(S) && I == IteratorType(S) && 
PseudoRelation(R) && I == Domain(R)) 
triple<I, I, I> 
combine linked nonempty(I #0, І 10, I fi, I li, Rr, S Set link) 
t 
// 前 条 件 : bounded_range(f0,10) ^ bounded_range(f1,11) 
// WA fF: 10 #10 A f1 Z U Л disjoint(f0, 10, £1, 11) 
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typedef triple<I, I, I> Т; 
linker_to_tail<S> link to tail(set link); 


Ih;It; 
if (r(fi, #0)) { h = fi; advance tail(t, #1); goto s1; } 
else { h = fO; advance tail(t, #0); goto s0; } 
s0: if (fO -- 10) goto s2; 
if (r(fi, £0) { linkto tail(t, f1); goto si; Y 
else 4 advance_tail(t, £0); goto s0; } 
si: if (£1 == 11) goto s3; 
if (r(fi, £0)) { advance_tail(t, #1); goto si; } 
else { link_totail(t, #0); goto s0; } 


82: set link(t, fl); return T(h, t, 11); 
83: set link(t, fO); return T(h, t, 10); 
} 


练习 8.2 请 实现 combine linked, 它 允 许 空 的 输入 . 这 时 应 该 返回 什么 作为 最 后 
访问 的 迭代 器 ? 


上 面 过程 也 是 一 个 状态 机 . 变量 + 指向 输出 范围 的 尾 . 其 中 的 状态 对 应 于 
下 面 两 个 条 件 : 


s0: successor(t) = #0 A —r(f1, t) 
sl: successor(t) = #1 A r(t, #0) 


只 有 在 s0 和 sl 之 间 转 换 时 需要 重新 链接 . 


引 理 8.3 如 果 调用 combine_linked_nonempty(f0, 10, f1, L1, r, s) 返回 (h,t,1), 那么 其 
中 的 h 等 于 f0 或 fl, 而 且 与 之 独立 地 有 1 等 于 10 BR u. 


引 理 8.4 在 到 达 状 态 s2 时 t 位 于 原 范围 [£0, 10) 里 , successor(t) = 10 Н fl Z U. 
当 到 达 状 态 s3 时 , t 位 于 原 范围 [£1, 11) 里 , successor(t) = 11 A #0 Z 10. 


引 理 8.5 combine_linked_nonempty 是 保持 先 于 关系 的 链接 重 整 . 
第 三 个 机 器 链接 一 个 表 的 头 , 而 不 是 尾 : 
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template<typename I, typename S> 
requires(ForwardLinker(S) && I == IteratorType(S)) 


struct linker_to_head 


{ 
S set.link; 
linker to.head(const Sk set link) : set link(set link) ( } 
void operator( (I& h, Ik f) 
t 
// 前 条 件 : successor(f) 有 定义 
IteratorType(S) tmp = successor(f) ; 
set_link(f, h); 
h = f; 
f = tmp; 
* 
н 


借助 于 这 一 机 器 , 可 以 实现 一 个 迭代 器 范围 的 翻转 : 


template<typename I, typename S> 
requires(ForwardLinker(S) && I == IteratorType(S)) 
І reverse.append(I f, I 1, I h, S set link) 


1 
// W& fF: bounded range(f,1) A h € [f, 1) 
linker_to_head<I, S> link to.head(set link); 
while (f != 1) link to.head(h, f); 
return h; 

y 


为 了 避免 共享 的 真 尾部 , h 应 该 是 另 一 个 不 相交 的 表 的 头 (等 于 单 链表 ， 
nil 也 可 以 接受 ), 或 者 是 1 由 于 1 可 能 已 经 被 用 作 h 的 初 值 (这 样 给 出 的 是 
reverse_linked), 另外 送 一 个 独立 的 累积 参数 也 很 有 用 . 
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8.3 ”链接 重 整 的 应 用 


给 定 了 菜 链接 迭代 器 类 型 的 值 类 型 上 的 一 个 谓词 , 我 们 可 以 用 split linked 来 划 
分 范围 . 为 此 需要 有 一 个 适配器 , 把 值 上 的 谓词 转变 为 迭代 器 上 的 谓词 : 


template<typename I, typename P> 
requires(Readable(I) && 
Predicate(P) && ValueType(I) == Domain(P)) 


struct predicate_source 


{ 
P p; 
predicate source(const Рё p) : p(p) +} 
bool operator()(I i) 
{ 
return p(source(i)); 
} 
Y 


有 了 这 个 适配器 , 就 可 以 把 一 个 范围 划分 为 一 个 值 不 满足 给 定 谓词 的 范 
B, 以 及 另 一 个 值 满足 给 定 谓词 的 范围 了 : 


template<typename I, typename S, typename P> 
requires(ForwardLinker(S) && I == IteratorType(S) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
pair< pair<I, I>, pair<I, I> > 
partition linked(I f, I 1, P p, S set link) 
f 
predicate.sourceXI, P> ps(p); 
return split linked(f, 1, ps, set link); 


给 定 了 某 个 链接 迭代 器 类 型 的 值 类 型 上 的 一 个 弱 序 , 我 们 就 可 以 借助 
combine_linked_nonempty 来 归并 两 个 递增 的 范围 . 同样 的 , 这 里 也 需要 一 个 适 配 
器 , 用 于 把 值 上 的 关系 转换 为 迭代 器 上 的 关系 : 
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template<typename 10, typename I1, typename R> 
requires(Readable(IO) && Readable(I1) && 
ValueType(IO) == ValueType(I1) && 
Relation(R) && ValueType(IO) == Domain(R)) 


struct relation. source 


t 
R >; 
relation зоџгсе(сопзї R& r) : r(r) { } 
bool operator()(IO 10, I1 il) 
t 
return r(source(i0), source(i1)); 
£ 
н 


用 这 一 关系 组 合 了 两 个 范围 之 后 , 剩 下 的 工作 就 是 找 出 组 合 范围 的 最 后 一 
PERS, 并 将 它 设 置 到 11: 


template<typename I, typename S, typename R> 
requires(Readable(I) && 
ForwardLinker(S) && I == IteratorType(S) && 
Relation(R) && ValueType(I) == Domain(R)) 
pair<I, I> merge linked nonempty(I #0, I 10, I fi, I 11, 
R r, S set link) 
1 
// 前 条 件 : (0 AWA AU 
// 前 条 件 : increasing range(f0, 10, т) 
// Wi & (fF: increasing range(f1, 11, r) 
relation sourceXI, І, R> rs(r); 
triple<I, I, I> t = combine linked nonempty(fO, 10, fl, 11, 
rs, set link); 
set link(find last(t.mi, t.m2), 11); 
return pairXI, I>(t.m0, 11); 
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} 


引 理 8.6 35 [f0, 10) 和 [£1, 11) 都 是 非 空 的 递增 限界 范围 ,用 merge_linked_nonempty 
归并 它们 将 得 到 一 个 递增 的 范围 . 


引 理 8.7 如 果 i0 c [f0,10) Mile [flU) 是 两 个 迭代 器 , 其 值 在 + 下 等 价 , 用 
merge linked nonempty 归并 这 两 个 范围 后 i0 < 11. 


有 了 merge_linked_nonempty, 立刻 就 可 以 实现 归并 排序 : 


template<typename I, typename S, typename R> 
requires(Readable(I) && 
ForwardLinker(S) && I == IteratorType(S) && 
Relation(R) && ValueType(I) == Domain(R)) 
pair<I, I> sort.linked nonempty n(I f, DistanceType(I) n, 
R г, S set. link) 


// WI & tF: counted range(f, n) An > 0 A weak_ordering(r) 
typedef DistanceType(I) N; 
typedef pair<I, I> P; 
if (п == N(1)) return P(f, successor(f)); 
N h = half.nonnegative(n); 
P pO = sort.linked.nonempty.n(f, h, r, set link); 
P pi = sort linked nonempty.n(pO.mi, n - h, г, set link); 
return merge linked nonempty(pO.mO, pO.mí, 
рі.п0, pi.mi, г, set link); 
} 


3| 38 8.8 sort_linked_nonempty_n 是 一 个 链接 重 整 . 


引 理 8.9 如 果 [r,n) 是 非 空 的 计数 范围 , sort-linked-nonempty-n 将 把 它 重 整 为 一 
个 递增 的 限界 范围 . 


一 个 链接 范围 的 相对 于 某 个 弱 序 的 排序 是 稳定 的 (stability), 如 果 在 输 
入 范围 中 有 两 个 具有 关系 1<j 的 迭代 器 , 而 且 它们 的 值 按 关 系 + 等 价 , 那么 在 
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输出 中 必 有 <i 
313 8.10 sort_linked_nonempty_n 相对 于 所 提供 的 弱 序 * 是 稳定 的 . 


练习 8.3 请 设法 确定 sort linked nonempty.n. 里 的 关系 和 链接 对 象 应 用 的 最 大 和 
平均 次 数 . 


虽然 sort-linked-nonempty-n 中 的 运算 执行 次 数 接近 最 优 , 如 果 被 排序 的 链 
接 结构 太 大 , 因而 不 能 放 入 缓存 , 引用 局 部 性 (locality of reference) 方面 的 糟糕 
情况 也 会 限制 这 个 算法 的 有 用 性 . 在 这 种 情况 下 , 如 果 存 在 可 用 的 额外 存储 ， 
就 应 该 把 链接 表 拷 贝 到 一 个 数组 里 , 然后 在 数组 里 排序 . 

链接 表 排 序 并 不 要 求 predecessor 的 值 . 如 果 把 下 式 当 作 不 变 式 


i = predecessor(successor(i)) 


为 维持 它 而 做 的 反 向 链接 运算 的 次 数 将 正比 于 比较 的 次 数 . 我 们 可 以 通过 临 
时 打破 上 面 不 变 式 的 方式 避免 这 种 额外 工作 . 假设 1 是 一 个 链接 的 双向 迭代 
器 类 型 , 而 forward.linker 和 backward_linker 分 别 是 1 的 前 向 和 反 向 链接 对 象 . 
我 们 可 以 把 forward. linker 送 给 排序 过 程 , 也 就 是 说 , 把 这 个 表 当 作 一 个 单 链 
表 处 理 , 最 后 再 通过 对 第 一 个 之 后 的 每 个 迭代 器 应 用 backward.linker 来 恢复 
predecessor 链接 : 


pair<I, I> р = sort_linked nonempty n(f, n, 
т, forward linker); 
f = p.m0; 
while (f != p.m1) { 
backward linker(f, successor(f)); 
f = successor(f); 
+ 


练习 8.4 请 实现 一 个 保持 先行 关系 的 链接 重 整 过 程 unique, 它 以 一 个 链接 范围 
和 定义 在 迭代 器 的 值 类 型 上 的 一 个 等 价 关 系 为 参数 , 产生 出 两 个 范围 . 如 果 紧 
随 一 个 迭代 器 之 后 的 一 些 迭 代 器 具有 与 之 等 价 的 值 , 该 过 程 把 这 样 的 迭代 器 
序列 都 放 到 第 二 个 范围 里 . 
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允许 修改 successor 产生 了 各 种 链接 重 整 算法 , 例如 组 合 和 划分 . 让 其 他 坐标 结 
构 具 有 可 变 的 遍历 函数 也 很 有 用 . 现在 用 链接 二 叉 坐 标 来 阐释 这 方面 的 想法 . 

对 链接 和 迭代 器 , 前 面 是 把 链接 运算 作为 参数 传 给 它 , 这 是 因为 可 能 需要 不 
同 的 链接 运算 . 例如 , 在 排序 之 后 可 能 需要 重新 恢复 反 向 链接 . 对 链接 的 二 叉 
坐标 , 至 今 尚 未 看 到 需要 用 不 同 版 本 的 链接 运算 的 情况 , 所 以 采用 在 概念 里 定 
义 它们 的 方式 : 


LinkedBifurcateCoordinate(T) 全 
BifurcateCoordinate(T) 
A set_left_successor : T x T — void 
(i,j) — 建立 left_successor(i) = j 
A set-_right_successor : T x T — void 


(i,j) + 建立 right.successor(i) = j 


set left successor 和 set right successor 的 定义 空间 是 非 空 坐标 的 集合 . 

树 的 概念 衍生 出 很 丰富 的 一 集 有 用 数据 结构 和 算法 . 作为 本 章 的 一 个 总 
结 , 下 面 将 给 出 一 小 组 算法 , 其 中 展示 了 一 种 很 重要 的 编程 技术 . 该 技术 称 为 
链接 反 转 (link reversal), 用 于 在 遍历 树 的 过 程 中 修改 链接 , 完成 遍历 之 后 恢复 
原来 的 状态 , 其 间 只 需要 常量 的 额外 空间 . 链接 反 转 需要 另外 的 公理 , 以 便 处 
理 空 坐标 的 情况 . 遍历 函数 对 这 种 坐标 无 定义 : 


EmptyLinkedBifurcateCoordinate(T) 全 
LinkedBifurcateCoordinate(T) 
A empty(TQ)? 
A —empty(i) = 
left successor(i) 和 right successor(i) 有 定义 
A ~empty(i) > 
(—һаѕ Іей successor(i) => empty(left-successor(i))) 
A —empty(i) = 


(^has.right. successor(i) «> empty(right-successor(i))) 





2. 换 句 话说 , empty 对 默认 构造 的 值 为 真 , 可 能 对 另外 一 些 值 也 为 真 . 
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第 7 章 介 绍 的 traverse step 是 遍历 双向 二 又 坐标 的 一 种 有 效 方法 , 但 它 需 
要 用 到 predecessor 函数 . 如 果 predecessor 函数 不 可 用 , 而 且 由 于 树 的 不 平衡 , ( 基 
FRK) 递归 遍历 又 无 法 接受 , 那么 就 可 以 采用 下 面 的 链接 反 转 技术 , 在 一 个 
平常 用 于 保存 后 继 的 链接 中 临时 性 地 存 一 下 到 前 驱 的 链接 , 以 保证 存在 一 条 
回 到 根 的 路 径 .3 

如 果 考 虑 一 个 树 结 点 的 左 后 继 和 右 后 继 , 再 加 上 前 一 树 结 点 的 坐标 构成 的 
三 元 组 , 用 下 面 机 器 可 以 完成 这 个 三 元 组 中 三 个 成 员 的 轮换 : 


template<typename C> 
requires(EmptyLinkedBifurcateCoordinate(C)) 
void tree.rotate(C& curr, Сё prev) 


t 
// 前 条 件 : —empty(curr) 
C tmp = left successor(curr); 
set left successor(curr, right successor(curr)); 
set right successor(curr, prev); 
if (empty(tmp)) ( prev = tmp; return; } 
prev 7 curr; 
curr = tmp; 
> 


反复 应 用 tree_rotate 就 能 遍历 整个 树 : 


template<typename C, typename Proc> 
requires (EmptyLinkedBifurcateCoordinate(C) && 
Procedure(Proc) && Arity(Proc) == 1 ёё 
С == InputType(Proc, 0)) 
Proc traverse_rotating(C c, Proc proc) 
T 
// 前 条 件 : tree(c) 





3. 链 接 反 转 技 术 由 Schorr and Waite [1967] 引进 , L. P. Deutsch 独立 地 发 现 了 这 种 技术 . 没有 标 
志 位 的 技术 是 Robson [1973] Al Morris [1979] 发 表 的 . 我 们 在 这 里 给 出 的 特殊 的 链接 轮换 技术 
应 归功 于 Lindstrom [1973], 还 有 Dwyer [1974] 的 独立 工作 . 
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if (empty(c)) return proc; 
C curr = с; 
C prev; 
do { 
proc(curr) ; 
tree.rotate(curr, prev); 
} while (curr != с); 
do { 
proc(curr) ; 
tree rotate(curr, prev); 
} while (curr != с); 
proc(curr) ; 
tree rotate(curr, prev); 
return proc; 
F 


定理 8.1 考虑 traverse rotating(c, proc) 的 一 次 调用 和 c 的 任何 非 空 后 代 i, 其 中 
i 有 初始 的 左右 后 继 1 和 + 以 及 前 驱 p. 那么 
1. i 的 左右 后 继 历经 三 次 迁移 : 
(ьт) Р (тур) 5 (9,0 F (tr) 
2. 如 果 m A n, ELA т MLM, EB (тур) D (9,0 和 (9,0 ° (т) 分 别 
做 3n, + 1 Al Зп, 十 1 次 tree. rotate 调用 . 


3. WR k Ж tree rotate 调用 的 运行 计数 器 , 在 i 的 后 继 的 三 次 迁移 时 ， 
kmod 3 的 值 各 不 相同 . 


4. 在 调用 traverse_rotating(c, proc) 期 间 , 调用 tree rotate 的 总 次 数 是 3n, 其 
Hon Ë c 的 权重 . 


证 明 . 对 n Ac 的 权重 做 归纳 . 口 


练习 8.5 请 画 出 用 traverse rotating 38 Jj — Ж 7 个 结 点 的 完全 二 叉 树 的 过 程 中 
历经 的 每 个 状态 . 
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traverse rotating 将 执行 与 第 7 章 的 traverse nonempty 一 样 的 前 序 、 中 序 和 
后 序 序列 . 但 是 很 可 异 , 我 们 不 知道 如 何 确定 对 某 坐 标的 一 次 特定 访问 究竟 是 
pre, in, 还 是 post 访问 . 然而 , 还 是 可 以 利用 traverse_rotating 计算 一 些 有 用 的 东 
西 , 例如 一 棵 树 的 权重 : 


template<typename T, typename N> 

requires (Integer (N)) 
struct counter { 

Nn; 

counter() : n(0) { } 

counter(N n) : n(n) { } 

void operator()(const T&) { п = successor(n); } 
3; 


template<typename C> 
requires (EmptyLinkedBifurcateCoordinate(C)) 
WeightType(C) weight rotating(C c) 


t 

// B f: tree(c) 

typedef WeightType(C) N; 

return traverse rotating(c, counter<C, N>()).n / N(3); 
} 


利用 访问 计数 值 取 模 3, 就 可 以 访问 每 个 坐标 恰好 一 次 : 


template<typename N, typename Proc> 

requires(Integer(N) && 

Procedure(Proc) && Arity(Proc) == 1) 

struct phased applicator 
1 

N period; 

N phase; 

Nn; 
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// 不 变 式 : n, phase € [0, period) 

Proc proc; 

phased applicator(N period, N phase, N n, Proc proc) : 
period(period), phase(phase), n(n), proc(proc) ( } 

void operator()(InputType(Proc, 0) x) 


{ 
if (n == phase) proc(x); 
п = successor(n); 
if (п == period) п = 0; 
} 


m 


template<typename C, typename Proc» 
requires(EmptyLinkedBifurcateCoordinate(C) && 
Procedure(Proc) && Arity(Proc) -- 1 && 
C == InputType(Proc, 0)) 
Proc traverse phased rotating(C c, int phase, Proc proc) 
1 
// Bf: tree(c) AO < phase < 3 
phased_applicator<int, Proc» applicator(3, phase, 0, proc); 
return traverse rotating(c, applicator).proc; 


$ 


ТАН 8.1 考虑 用 treerotate 实现 二 叉 树 上 的 同 构 、 等 价 和 有 序 . 


8.5 结论 


带 有 可 变 遍 历 函数 的 链接 坐标 结构 可 以 支持 各 种 有 用 的 重 整 算法 , 例如 链接 
范围 的 排序 . 从 一 个 简单 的 像 机 器 一 样 的 组 件 组 合 出 这 类 算法 , 可 以 得 到 具有 
精确 的 数学 性 质 的 有 效 代码 . 按 一 定 的 规矩 使 用 goto 是 实现 状态 机 的 一 种 正 
统 方式 . 如 果 一 个 不 变 式 涉及 多 个 对 象 , 在 更 新 这 些 对 象 之 一 的 期 间 有 可 能 需 
要 临时 性 地 违背 不 变 式 . 一 个 算法 定义 了 一 个 区 域 , 可 以 允许 在 其 内 部 临时 地 
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违背 不 变 式 . 只 要 能 保证 在 退出 这 种 区 域 之 前 恢复 不 变 式 , 就 允许 出 现 暂时 违 
背 的 情况 . 
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拷贝 


Г. — 其 访问 函数 允许 修改 迭代 器 的 值 . 这 里 用 一 族 拷贝 
算法 来 展示 可 写 和 迭代 器 的 使 用 , 这 些 算法 的 基础 是 一 个 简单 机 器 , 其 功能 就 是 
拷贝 一 个 对 象 并 更 新 其 输入 和 输出 迭代 器 . 仔细 描述 的 前 条 件 将 允许 输入 和 
输出 范围 在 找 贝 期 间 部 分 重 本 . 如 果 两 个 同样 大 小 的 不 重 登 范围 都 允许 修改 ， 
那么 就 可 以 用 一 些 对 换算 法 去 交换 它们 的 内 容 . 


91 THE 


本 章 讨 论 和 迭代 器 和 其 他 坐标 结构 的 第 二 类 访问 : 可 写 性 . 一 个 类 型 称 为 可 写 的 ， 
如 果 一 元 过 程 sink 在 其 上 有 定义 . sink 只 能 用 在 赋值 的 左 部 , 赋值 的 右 部 求 值 
得 到 的 应 是 类 型 ValueType(T) 的 一 个 对 象 : 


Writable(T) 全 
ValueType : Writable 一 Regular 
^ (Ух € T) (Vv € ValueType(T)) sink(x) — v 是 良 构 的 语句 


sink(x) 的 符合 Writable 概念 的 使 用 只 有 放 在 赋值 左 部 . 当然 , 完全 可 以 有 
某 些 特殊 类 型 的 Writable 的 模型 支持 其 他 使 用 方式 . 

sink 不 必 是 全 的 , 在 一 个 可 写 类 型 里 完全 可 能 存在 一 些 sink 无 定义 的 对 象 . 
就 像 可 读 性 的 情况 一 样 , 可 写 性 概念 也 不 提供 定义 空间 谓词 来 确定 sink 是 否 
对 某 个 特定 对 象 有 定义 . 在 算法 里 使 用 sink 的 合法 性 只 能 根据 前 条 件 确 定 . 

对 于 对 象 x 的 一 个 特定 状态 , Writable 概念 只 保证 对 sink(x) 的 一 次 赋值 是 
合法 的 . 有 可 能 存在 某 些 特定 类 型 的 Writable, 它们 提供 了 某 种 规程 , 允许 对 
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sink(x) 的 后 续 赋值 .1 

可 写 对 象 x fl n] EXT u 互 为 别名 (aliased) 的 条 件 是 sink(x) 和 source(y) 
两 者 都 有 定义 , 而 且 无 论 把 什么 值 v RAT sink(x), 都 会 导致 它 作为 source(v) 
的 值 反 应 出 来 : 


property(T: Writable, U : Readable) 
requires(ValueType(T) = ValueType(U)) 
aliased : Tx U 
(x,y) к sink(x) 有 定义 人 
source(y) 有 定义 人 
(Vv € ValueType(T)) sink(x) — v 建立 source(y) =v 


最 后 一 类 访问 称 为 可 变动 (mutable), 它 是 可 读 性 和 可 写 性 的 一 种 合理 的 
组 合 方式 : 


Mutable(T) 全 
Readable(T) A Writable(T) 
^ (Vx € Т) sink(x) 有 定义 €» source(x) 有 定义 
A (Wx € T)sink(x) 有 定义 = aliased(x, x) 
^ deref : T — ValueType(T)& 
^ (Vx € T)sink(x) 有 定义 €» deref(x) 有 定义 


XY FY 28 27 35 4 38, 将 source(x) 或 sink(x) # Jy deref(x) 不 会 影响 程序 执行 的 意义 ， 
同时 建 模 Writable 和 Iterator 的 某 选 代 器 类 型 的 一 个 范围 称 为 是 可 写 范 
M (writable range), 如 果 sink 对 该 范围 里 的 所 有 和 迭代 器 都 有 定义 : 
ргорегїу(1: Writable) 
requires( /terator(1)) 


writable bounded.range : I x I 
(f,1) ++ bounded. range(f, 1) ^ (Vi € [f, 1)) sink(i) 有 定义 


可 以 类 似 地 定义 writable weak range 和 writable counted range . 





1. Jerry Schwarz 提出 了 一 种 可 能 更 优美 的 接口 : 把 sink 换 成 过 程 store, 使 storefvx] 等 价 于 


sink(x) — v. 
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允许 对 可 读 和 迭代 器 1 多 次 调用 source(i), 而 且 保 证 这 些 调用 总 返回 同一 个 
值 . 也 就 是 说 , 这 里 的 source 是 规范 的 . 这 一 规范 性 使 我 们 可 能 写 出 一 些 简单 而 
且 有 用 的 算法 , 例如 find if. 然而 , 对 可 写 迭 代 器 j 而 言 , 对 sink(j) 的 赋值 就 不 
是 可 重复 的 : 通过 一 个 迭代 器 的 两 次 赋值 之 间 必 须 有 一 个 successor 调用 分 隔 . 
可 读 和 可 写 迭 代 器 之 间 的 不 对 称 性 符合 我 们 的 需要 : 看 来 它 不 会 排除 有 用 的 
算法 , 同时 又 能 允许 一 些 模型 , 例如 非 缓冲 的 输出 流 . 在 Iterator 概念 里 非 规范 
的 successor 和 非 规范 的 sink 可 以 支持 一 些 算法 , 它们 不 仅 可 以 用 于 内 存 数 据 结 
构 , 还 可 以 用 于 输入 流 和 输出 流 . 

同时 建 模 Mutable 和 ForwardIterator 某 迭 代 器 类 型 的 一 个 范围 称 为 可 变 
动 范围 (mutable range), 如 果 sink, source 和 deref 对 该 范围 里 的 所 有 迭代 器 都 
有 定义 . 只 有 多 遍 的 算法 会 对 同一 个 范围 的 迭代 器 既 读 又 写 . 这 样 , 对 可 变动 
范围 , 我 们 至 少 需要 前 向 迭代 器 , 两 次 赋值 之 间 也 不 再 要 求 有 successor ЇЙ №: 


property(1: Mutable) 
requires( ForwardIterator(1)) 
mutable bounded range : I x I 
(f, 1) + bounded. range(f, 1) ^ (Vi € [f,1)) sink(i) 有 定义 


mutable.weak.range 和 mutable counted range 可 以 类 似 定义 . 


9.2 基于 位 置 的 拷贝 


现在 要 给 出 一 族 算法 , 它们 从 一 个 或 几 个 输入 范围 拷贝 对 象 到 一 个 或 几 个 输 
出 范围 . 一 般 而 言 , 这 些 算法 的 后 条 件 都 要 描述 输出 范围 里 的 对 象 与 输入 范围 
里 的 对 象 的 原 值 相等 . 当 输 入 范围 和 输出 范围 不 重 双 时 很 容易 建立 所 期 望 的 
后 条 件 . 然而 , 在 存在 重 登 的 范围 之 间 拷贝 对 象 也 很 有 用 , 这 里 每 个 算法 的 后 条 
件 都 需要 描述 所 允许 的 重 登 情况 . 

如 果 输 入 范围 里 的 一 个 迭代 器 与 输出 范围 里 的 一 个 迭代 器 互 为 别名 , 就 要 
遵循 有 关 重 又 的 基本 规则 : 算法 不 能 在 将 sink 作用 于 给 定 的 输出 迭代 器 之 后 ， 
PE source 也 作用 于 相应 的 输入 迭代 器 . 在 下 面 给 出 的 各 种 算法 里 , 都 需要 开 
发 出 一 些 精确 的 条 件 和 一 般 的 性 质 来 表述 这 方面 的 情况 . 
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下 面 将 基于 一 些 机 器 组 合 起 各 种 拷贝 算法 , 这 些 机 器 都 引用 了 两 个 迭代 
38, 它们 不 但 负责 拷贝 , 也 负责 更 新 这 些 和 迭代 器 . 最 常用 的 一 部 机 器 完成 一 个 
对 象 的 拷贝 , 还 将 两 个 迭代 器 各 向 前 推进 一 步 : 


template<typename I, typename 0> | 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0)) 
void copy.step(I& f.i, O& f-o) 


t 
// 前 条 件 : source(f,) 和 sink(f。) 有 定义 
sink(f_o) = source(f.i); 
f.i = successor(f i); 
f.o = successor(f.o); 
} 


拷贝 算法 的 一 般 形 式 是 反复 执行 一 种 基本 的 拷贝 步骤 , 直至 某 个 终止 条 件 
满足 . 举例 说 , 下 面 的 copy 将 一 个 半 开 的 有 界 范围 拷贝 到 一 个 输出 范围 , 相应 
输出 范围 由 该 范围 的 第 一 个 迭代 器 描述 : 


template<typename I, typename 0> 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0)) 
0 copy(I f.i, I li, 0 f-o) 


€ 
// BI & fF: not_overlapped_forward(f,,l,, fo, fo + (li — fi) 
while (f.i != Li) copy.step(f i, f_o); 
return ѓо; 

x 


copy 返回 输出 范围 的 极限 , 这 是 因为 调用 方 原来 可 能 不 知道 它 . 输出 迭代 
器 类 型 可 能 不 允许 多 遍 遍 历 , 在 这 种 情况 下 , 如 果 不 返 回 这 个 极限 , 后 面 可 能 就 
无 法 再 找到 它 了 . 
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copy 的 后 条 件 是 输出 范围 里 的 值 序列 等 于 输入 范围 里 原来 的 值 序列 . 为 
满足 这 一 后 条 件 , 前 条 件 必须 保证 输入 和 输出 范围 分 别 可 读 和 可 写 ; 输出 范围 
必须 足够 大 ; 还 有 , 如 果 输 入 范围 和 输出 范围 重叠 , 那么 不 会 出 现 通过 一 个 输出 
和 迭代 器 写 之 后 再 通过 与 它 别 名 的 某 输 入 迭代 器 去 读 的 情况 . 这 些 条 件 可 以 借 
助 性 质 not_overlapped forward 的 帮助 进行 形式 化 . 一 个 可 读 范围 和 一 个 可 写 范 
围 没有 重 本 的 前 程 (overlapped forward), 条 件 是 , 如 果 任 何 别名 迭代 器 出 现在 
输入 范围 里 , 其 在 输入 范围 里 的 索引 都 不 超过 其 在 输出 范围 里 的 索引 : 


property(1: Readable, O : Writable) 
requires( Iterator (I) ^ Iterator(O)) 
not. overlapped forward : 1x Ix Ox O 
(fis lo fos bo) к 
readable_bounded_range(f;, l;) ^ 
writable_bounded_range(f,, lo) A 
(Vki € [fu t))(Vk, € [fos te)) 
aliased(k,, ki) = ki — f, < k, — fo 


有 时 输入 范围 和 输出 范围 的 规模 可 能 不 同 : 


template<typename I, typename 0> 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0)) 
pair<I, 0> copy.bounded(I # і, I 1i, O f.o, O 1-0) 


$ 
// ATÆ fF: not overlapped forward(f,, l, fo, le) 
while (fi != li &k f o !- 10) copy.step(f.i, f.o); 
return pair<I, O»(f.i, f_o); 

} 


如 果 调 用 方 同时 知道 两 个 范围 的 结束 位 置 , 返回 这 样 的 一 对 迭代 器 , 就 使 
调用 方 可 以 确定 哪个 范围 较 小 , 以 及 较 大 范围 里 的 拷贝 在 哪里 结束 . 与 copy 比 
较 一 下 , 可 以 看 到 输出 的 前 条 件 被 弱化 了 : 现在 输出 范围 可 以 比 输入 范围 短 . 
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有 人 甚至 会 说 最 弱 的 前 条 件 应 该 是 
not_overlapped_forward(f,, fi +n, fo; fo + n) 


其 中 mn = min(l — f, lo — fo). 
下 面 辅助 机 器 处 理 计 数 范围 的 终止 条 件 : 


template<typename N> 


requires(Integer(N)) 

bool count_down(N& n) 

f 
// 前 条 件 : n> 0 
if (zero(n)) return false; 
n = predecessor (n) ; 
return true; 

} 


下 面 的 copy.n 算法 将 一 个 半 开 的 计数 范围 拷贝 到 一 个 输出 范围 , 相应 输出 
范围 由 该 范围 的 第 一 个 迭代 器 描述 : 


template<typename I, typename 0, typename N> 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0) && 


Integer(N)) 
pair<I, 0> copy.n(I f.i, N n, 0 f.o) 
i 
// BI Ж fF: пої overlapped.forward(f,, f... fos forn) 
while (count down(n)) copy.step(f i, f-o); 
return pair<I, O»(f i, f 0); 
} 


对 两 个 计数 范围 做 copy-bounded 的 效果 , 也 可 以 通过 以 两 者 之 中 较 小 的 范 
围 的 规模 调用 сору п 的 方式 获得 . 
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当 范 围 之 间 有 重合 的 前 程 时 , 如 果 所 用 的 迭代 器 建 模 Bidirectionallterator 
并 因此 允许 反 向 走 , 那么 仍然 可 以 拷贝 . 这 一 情况 提示 了 下 面 的 机 器 : 


template<typename I, typename 0> 
requires(Readable(I) && Bidirectionallterator(I) && 
Writable(0) &£ Bidirectionallterator(0) && 
ValueType(I) == ValueType(0)) 
void copy.backward step(I& 1-1, 0& 10) 


1 
// Йй # ff: source(predecessor(t;)) 和 sink(predecessor(1,)) 有 定义 
l.i = predecessor(1-i); 
1.0 = predecessor(1.0); 
Sink(l.o) = source(1_i); 
} 


由 于 这 里 处 理 的 是 半 开 范围 , 并 需要 从 它 的 极限 位 置 开 始 , 因此 需要 在 拷 
贝 之 前 先 将 和 迭代 器 退 一 步 , 这 样 就 得 到 了 copy. backward: 


template<typename I, typename 0> 
requires(Readable(I) && Bidirectionallterator(I) && 
Writable(0) && Bidirectionallterator(0) &k 
ValueType(I) == ValueType(0)) 
0 сору Баскиага(ї f.i, I li, 0 1.0) 


{ 
// BI & fF: not overlapped. backward(f,, tt — (1, — fi), le) 
while (f.i != li) copy.backward step(li, 1.0); 
return 10; 

} 


copy_backward.n 与 此 类 似 . 

copy-backward 的 后 条 件 类 似 于 copy, 可 以 利用 性 质 not_overlapped_backward 
对 它 进 行 形式 化 .一 个 读 范围 和 一 个 写 范 围 没 有 重要 的 后 程 (overlapped 
backward), 如 果 任 何 别名 和 迭代 器 出 现在 输入 范围 里 的 从 极限 开始 计算 的 索引 ， 
都 不 超出 它 在 输出 范围 里 从 极限 开始 计算 的 索引 : 
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property(1: Readable, O : Writable) 
requires( Iterator (1) ^ Iterator(O)) 
not overlapped backward : I x Ix Ox O 
(fulu folo) њ 
readable bounded range(f;, l) A 
writable bounded range(f,, lo) A 
(Vk, € [fo &))(V, € [fos 1o)) 
aliased(k,, ki) > L — ki < lo — ko 


如 果 两 个 范围 里 的 迭代 器 类 型 都 建 模 Bidirectionallterator, 就 可 以 像 反 转 
输入 范围 的 方向 一 样 反 转 输出 范围 的 方向 . 下 面 是 这 样 一 部 机 器 , 它 能 一 边 在 
输出 范围 里 反 向 走 , 一 边 也 在 输入 范围 里 反 向 走 : 


template<typename I, typename 0> 
requires(Readable(I) && Bidirectionallterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0)) 
void reverse copy.step(I& l.i, O& f.o) 


t 
// 前 条 件 : source(predecessor(1,)) 和 sink(£,) 有 定义 
li = predecessor(1.i); 
Sink(f.o) = source(1_i); 
f.o = successor (f_o); 
} 


template<typename I, typename 0> 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Bidirectionallterator(0) && 
ValueType(I) == ValueType(0)) 
void reverse.copy-backward step(I& f і, Ok 1_0) 
1 
// ВЕЗЕ: source(f,) 和 sink(predecessor(1,)) 有 定义 


l_o = predecessor(1 o); 
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sink(lo) = source(f.i); 
f.i = successor(f_i); 


} 
这 样 就 得 到 了 下 面 的 算法 : 


template<typename I, typename 0> 
requires(Readable(I) && Bidirectionallterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0)) 
0 reverse.copy(I f.i, I li, 0 f-o) 


t 
// WHE: not_overlapped(f., li, fos fo + (L — fi) 
while (f.i != li) reverse-copy-step(l_i, f_o); 
return f.o; 

y 


template<typename I, typename 0> 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Bidirectionallterator(0) && 
ValueType(I) == ValueType(0)) 
0 reverse_copy_backward(I f.i, I li, 0 1.0) 


í 
// BW fF: not-overlapped(f,, l, lo — (t — fi), lo) 
while (f.i != li) reverse copy.backward step(f.i, 1.0); 
return 10; 

Y 


reverse copy.n 5j reverse. сору Баскмага п 类 似 . 

reverse. copy 和 гемегѕе сору backward 的 后 条 件 是 : 输出 范围 是 输入 范围 里 
原 有 的 值 序列 的 反 转 拷贝 . 实用 (但 不 是 最 弱 ) 的 前 条 件 是 输入 和 输出 范围 不 
ER, 这 一 条 件 可 以 借助 性 质 not_overlapped 进行 形式 化 . 一 个 可 读 范围 和 一 个 
"I5 d HA £ # (overlapped) 的 条 件 是 它们 没有 共同 的 迭代 器 : 
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property(1: Readable, О : Writable) 
requires(Iterator(I) ^ Iterator(O)) 
not overlapped : I x Ix Ox O 
(f; ly fos lo) к» 
readable_bounded_range(f;, l) A 
writable_-bounded_range(f,,1,) A 
(Ук, € [fu t)) (Vk, € [f,,1,)) —aliased(k,, k.) 


练习 9.1 请 找 出 reverse copy 和 reverse сору backward 的 最 弱 前 条 件 . 


引进 сору Басмага 和 copy 的 主要 原因 是 要 处 理 在 任何 方向 上 重合 的 范 
E, 而 引进 reverse_copy_backward 和 reverse.copy, 则 是 为 了 能 在 针对 和 迭代 器 的 要 
求 上 取得 最 大 的 灵活 性 . 


9.3 基于 谓词 的 拷贝 


前 面 给 出 的 算法 都 把 输入 范围 里 的 所 有 对 象 拷贝 到 输出 范围 , 它们 的 后 条 件 
也 不 依赖 于 任何 迭代 器 的 值 . 本 节 的 几 个 算法 都 要 求 一 个 谓词 参数 , 通过 它 来 
控制 拷贝 工作 的 进行 . 

例如 , 让 拷贝 步骤 以 一 个 一 元 谓词 为 条 件 , 就 得 到 了 copy-select: 


template<typename I, typename 0, typename P> 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0) && 
UnaryPredicate(P) && I == Domain(P)) 
0 copy.select(I fi, I li, 0 ft, P p) 
t 
// 前 条 件 : not_overlapped_forward(f,, li, fr, f, + n.) 
// 其 中 的 n, 是 满足 p 的 迭代 器 数目 的 一 个 上 界 
while (fi != 11) 
if (р(#-1)) copy.step(f i, f-t); 


else f і = successor(f i); 
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return f_t; 


n 的 最 坏 情况 是 t 一 fi 上 下 文 可 能 保证 它 取 更 小 的 值 . 
更 常见 的 情况 是 谓词 不 作用 于 迭代 器 , 而 是 作用 于 它们 的 值 : 


template<typename I, typename 0, typename P> 
requires(Readable(I) && Iterator(I) && 
Writable(0) && Iterator(0) && 
ValueType(I) == ValueType(0) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
0 copy-if(I f.i, I 1i, O ft, P p) 


t 
// 前 条 件 : 与 copy select 相同 
predicate_source<I, P» ps(p); 
return copy.select(f i, li, f t, ps); 
} 


第 8 章 里 给 出 了 在 迭代 器 的 链接 范围 上 操作 的 splitlinked 和 
combine_linked_nonempty. 也 存在 与 之 类 似 的 拷贝 算法 : 


template<typename I, typename Of, typename 0.t, typename P> 
requires(Readable(I) && Iterator(I) && 
Writable(0.f) && Iterator(0.f) && 
Writable(0.t) && Iterator(0.t) && 
ValueType(I) == ValueType(0.f) && 
ValueType(I) == ValueType(0.t) && 
UnaryPredicate(P) && I == Domain(P)) 
раіг<0#, 0-t> split copy(I fi, I 1i, Of ff, 0+ ft, 
Pp 


// 前 条 件 : 见 下 
while (fi != Li) 
if (p(f.i)) copy.step(f i, f-t); 
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else copy-step(f-i, ff); 
return pair«0.f, O.t»(f f, ft); 


练习 9.2 请 写 出 split copy 的 后 条 件 . 


为 了 满足 其 后 条 件 , 对 split-copy 的 调用 必须 保证 两 个 输出 范围 绝 不 重用 . 
实际 上 也 可 以 允许 其 中 一 个 输出 范围 与 输入 范围 重 登 , 但 要 保证 它们 没有 重 
Ж #5 W 42 (overlapped forward). 这 样 就 得 到 了 下 面前 条 件 : 

not_write_overlapped(f;, ny, fr, m.) A 
((not-overlapped_forward(f;, li, fr, f; + ny) A not_overlapped(f;, li, #.,1.)) V 
(not.overlapped.forward(f;, li, f, f, +n.) A not.overlapped(f,, li, fy, ly))) 


其 中 的 nr An, 分 别 为 不 满足 和 满足 p 的 迭代 器 数目 的 上 界 . 

Tk Ji not_write_overlapped 的 定义 依赖 于 写 别 名 (write aliasing) 的 概念 : 这 一 
说 法 是 指 两 个 可 写 对 象 x 和 у, 对 它们 sink(x) 和 sink(y) 都 有 定义 , 而 且 任 何 可 
以 看 到 写 x 的 效果 的 观察 者 也 能 看 到 写 y 的 效果 : 


property(T: Writable, U : Writable) 
requires(ValueType(T) = ValueType(U)) 
write_aliased : T x U 
(x, y) ке sink(x) 有 定义 人 sink(y) 有 定义 人 
(VV € Readable) (Vv € V) aliased(x, v) +> aliased(y, v) 


RERET ож, ® Ж Ж (not write overlapped) 的 定义 , 也 就 是 说 , 两 个 可 写 
范围 没有 公共 的 别名 sink: 


property(Oo : Writable, Оз : Writable) 
requires(Iterator(Og) A Iterator(O;)) 
not. write overlapped : Og x Oo x O1 x O1 
(fo, to, fi, l1) 一 
writable bounded range(fo, lo) A 
writable bounded.range(f;, l1) A 
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(Vko € [fo, to))(Vk1 € [fi, l1)) —write_aliased(ko, ki) 


与 select.copy 的 情况 类 似 , 在 split-copy 的 最 常见 情况 中 , 谓词 并 不 作用 于 
迭代 器 本 身 , 而 是 作用 于 它们 的 值 :? 


template<typename I, typename Of, typename 0 t, typename P» 
requires(Readable(I) && Iterator(I) && 

Writable(0.f) && Iterator(0.f) && 

Writable(0.t) && Iterator(0.t) && 

ValueType(I) == ValueType(0.f) && 

ValueType(I) == ValueType(0-t) && 

UnaryPredicate(P) && ValueType(I) == Domain(P)) 
pair«0.f, O0.t» partition.copy(I f.i, I li, Of ff, Ot ft, 


Pp 
{ 
// WHEE: 与 split-copy 相同 
predicate_source<I, P> ps(p); 
return split.copy(f.i, li, ff, ft, ps); 
} 


两 个 输出 范围 里 的 值 都 保持 原 输入 范围 里 的 相对 顺序 ; partition-copy-n 的 
情况 与 此 类 似 . 
combine.copy 的 代码 同样 很 简单 : 


template<typename 10, typename I1，typename 0, typename R> 
requires(Readable(IO) && Iterator(IO) && 
Readable(I1) && Iterator(I1) && 
Writable(0) && Iterator(0) && 
BinaryPredicate(R) && 
ValueType(IO) == ValueType(0) && 
ValueType(I1) == ValueType(0) && 
0 == InputType(R, 1) && I1 == InputType(R, 0)) 
0 combine.copy(IO f.iO, IO l.iO, I1 fii, I1 lii, 0 f.o, R r) 





2. 这 一 接口 是 T. K. Lakshman 的 建议 . 
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// 前 条 件 : RUF 
while (f-i0 != 110 &k fil != 111) 
if (r(f.ii, f.i0)) copy.step(f.ii, f.o); 
else copy-step(f.iO, f.o); 
return copy(f.ii, lii, copy(f.iO, 1-10, f.0)); 


对 于 combine.copy, 输入 范围 之 间 的 读 重 又 是 可 以 接受 的 . 进一步 说 , th ft 
许 一 个 输入 范围 与 输出 范围 重 又 , 但 这 种 重 又 不 能 在 向 前 的 方向 , 而 且 在 反方 
向 的 偏 移 量 至 少 要 有 另 一 个 输入 范围 那么 大 . 这 些 要 求 在 combine-copy 的 前 条 
件 里 用 backward_offset tE JR Hii: 

(backward.offset(f,,, lio, fo, los li; — fi, ) A not.overlapped(f,, 1, , fo,1o)) V 

(backward.offset(f,, , la, fo, los lio — fig) A not-overlapped(fio, lios fo, 1,)) 
HERRY lo = fo + (Lio — fio) + (la — f) 是 输出 范围 的 极限 . 

一 个 可 读 范 围 、 一 个 可 写 范围 和 一 个 偏 移 量 n > 0 满足 backward offset 性 


质 的 条 件 是 : 如 果 在 输入 范围 的 一 个 索引 处 出 现任 何 别名 的 迭代 器 , 对 其 增加 
n, 也 不 会 超过 输出 范围 的 索引 : 


property(I : Readable, O : Writable, N : Integer) 
requires( Iterator(1) A Iterator(O)) 
backward_offset :I x 1 x Ox Ox N 
(fis is fos ln) к» 
readable_bounded_range(f,, L) A 
n20A 
writable bounded. range(f,, lo) A 
(Vk € [fo ))(Vk, € [f.,1.)) 
aliased(k,, k,) = k, — fi +n < k, — f, 


请 注意 , not_overlapped_forward(f,,1,, fo, lo) = backward offset(f,, l, fo, lo, 0). 


练习 9.3 请 写 出 combine_copy 的 后 条 件 , 并 证 明 只 要 前 条 件 成 立 , 后 条 件 也 必 
然 满足 . 
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combine_copy_backward 的 情况 类 似 . 要 保证 同样 的 后 条 件 成 立 , if 分 支 的 
顺序 必须 与 combine_copy 里 if 分 支 的 顺序 相反 : 


template<typename IO, typename Ii, typename 0, typename R> 
requires(Readable(IO) && Bidirectionallterator(IO) && 

Readable(I1) && Bidirectionallterator(I1) && 
Writable(0) && Bidirectionallterator(0) && 
BinaryPredicate(R) && 
ValueType(IO) == ValueType(0) && 
ValueType(I1) == ValueType(0) && 
10 == InputType(R, 1) && 11 == InputType(R, 0)) 

0 combine.copy.backward(IO 1-10, IO 1-10, Ii fii, I1 lii, 


010, Rr) 
t 
// BERE: 见 下 
while (f.iO != 1.10 && fii != Lii) { 
if (r(predecessor(1.ii), predecessor(1.i0))) 
Copy-backward.step(l iO, 1.0); 
else 
copy-backward step(l.ii, 1.0); 
} 
return copy.backward(f.iO, 110, 
copy_backward(f_i1, lii, 1.0)); 
> 


combine_copy_backward 的 前 条 件 是 
(forward offset(fio, lios fo, los li, — fa ) A not_overlapped(f,,,l:,, fo, 1„)) V 
(forward_offset(fi,, li; , fo, los lig — fig) A not.overlapped(f;,, lio» fos 1,)) 


SEH fo = 1 — (lig — fio) + (la — fu) 是 输出 范围 的 第 一 个 迭代 器 

一 个 可 读 范围 、 一 个 可 写 范 围 和 一 个 偏 移 量 n > 0 满足 性 质 forward-offset 
的 条 件 是 : 如 果 任 何 别名 和 迭代 器 出 现在 从 输入 范围 的 极限 开始 算 的 某 个 索引 ， 
将 其 增加 n, 也 不 会 超过 相应 别名 选 代 器 从 输出 范围 的 极限 开始 算 的 索引 : 
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property(1: Readable, O : Writable, N : Integer) 
requires(Iterator(1) A Iterator(O)) 
forward offset : Ix Ix Ox Ox N 
(fis Lis fos ln) к 
readable_bounded_range(f,,l;) A 
n20A 
writable bounded. range(f,, lo) ^ 
(Vk, € [fu ))(Vk, € [fo, to)) 
aliased(k,, ki) > h — ki +n € L, — k, 


注意 , not overlapped. backward(f,, li, fo, Lo) = forward.offset(f;, li, fo, lo, 0). 


练习 9.4 请 写 出 combine.copy- backward 的 后 条 件 , 并 证 明 只 要 其 前 条 件 成 立 , 后 
条 件 也 必然 满足 . 


把 值 类 型 上 的 一 个 弱 序 送 给 前 向 或 反 向 组 合 拷贝 算法 , 它们 都 能 归并 递增 
的 范围 : 


template<typename 10, typename I1，typename 0, typename R> 
requires(Readable(IO) && Iterator(IO) && 
Readable(I1) && Iterator(I1) && 
Writable(0) && Iterator(0) && 
Relation(R) && 
ValueType(IO) == ValueType(0) && 
ValueType(I1) == ValueType(0) && 
ValueType(I0) == Domain(R)) 
0 merge.copy(IO f.iO, IO 1.10, I1 #11, I1 Lii, O fo, R r) 
£ 
// 前 条 件 : В combine_copy 的 前 条 件 , FER 
// weak-ordering(r) A 
// increasing range(f,,, lig, r) A increasing range(f,, , L, , r) 
relation source<I1, IO, R> rs(r); 


return combine copy(f.iO, 110, fii, 111, f-o, rs); 
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template<typename IO, typename Ii, typename 0, typename R> 
requires(Readable(IO) && Bidirectionallterator(IO) && 

Readable(11) && Bidirectionallterator(Ii) && 
Writable(0) && Bidirectionallterator(0) && 
Relation(R) && 
ValueType(IO) == Үа1џеТуре(0) && 
ValueType(I1) == ValueType(0) && 
ValueType(I0) == Domain(R)) 

0 merge.copy-backward(IO f iO, IO 110, I1 fii, I1 1141, 010, 


R r) 
{ 
// 前 条 件 : BR combine-copy_backward 的 前 条 件 , 还 要 求 
// weak-ordering(r) A 
// increasing range(f;,, lig, r) A increasing-range(fi ,tu,T) 
relation_source<Ii, IO, R> rs(r); 
return combine copy.backward(f.iO, 1.10, f ii, lii, 1.0, 
rs); 
} 


练习 9.5 实现 combine_copy_n 和 combine.copy-backward. n, 给 出 适当 返回 值 . 


引 理 9.1 如 果 两 个 输入 范围 规模 分 别 为 no 和 ni, 在 最 坏 情 况 下 merge_copy 和 
merge-copy-backward 将 执行 no 十 ni 次 赋值 及 no + n — 1 次 比较 . 


练习 9.6 请 确定 最 好 的 和 平均 的 比较 次 数 . 


项 目 9.1 现代 计算 系统 都 为 内 存 拷贝 提供 了 高 度 优化 的 库 过 程 ; 例如 memmove 
和 memcpy, 其 中 使 用 了 本 书 中 没有 讨论 的 优化 技术 . 请 研究 你 的 平台 提供 的 过 
程 , 设法 确定 它们 采用 的 技术 (例如 , 循环 展开 和 软件 流水 线 ), 并 设计 出 抽象 过 
程 来 尽 可 能 地 表达 这 些 技术 . 每 种 技术 需要 哪些 类 型 需求 和 前 条 件 ? 哪些 语言 
扩充 使 编译 器 能 拥有 采纳 这 些 技术 的 全 部 灵活 性 ? 
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程序 里 除了 经 常 需要 将 一 个 范围 拷贝 到 另 一 个 范围 外 , 有 时 也 很 需要 交换 
(swap) 两 个 同样 大 小 的 范围 : 一 一 对 换 两 个 范围 里 处 于 同样 位 置 的 各 对 对 象 的 
值 . 交换 算法 很 像 前 面 的 拷贝 算法 , 只 是 其 中 的 赋值 用 一 个 过 程 取代 , 该 过 程 交 
换 由 两 个 可 变动 迭代 器 指 着 的 对 象 的 值 : 


template<typename I0, typename I1> 
requires(Mutable(IO) && Mutable(I1) && 
ValueType(IO) == ValueType(I1)) 


void exchange.values(IO x, I1 y) 


€ 
// WI & fF: deref(x) 和 deref(y) 有 定义 
ValueType(IO) t = source(x); 
sink(x) = source(y); 
sink(y) = t; 
} 


练习 9.7 exchange. values 的 后 条 件 是 什么 ? 
引 理 9.2 exchange-values(i, j) 和 exchange_values(j,i) 的 效果 等 价 . 


我 们 可 能 希望 exchange-values 的 实现 只 是 交换 两 个 对 象 值 , 而 不 实际 构造 
或 销毁 任何 对 象 , 这 样 它 的 代价 就 不 会 随 着 被 交换 对 象 拥有 的 资源 量 的 增加 
而 增加 . 第 12 章 里 将 通过 基础 类 型 (underlying type) 的 概念 达到 这 一 目标 . 

就 像 做 拷贝 一 样 , 现在 也 从 几 个 机 器 出 发 构造 各 种 交换 算法 , 这 些 机 器 都 
以 两 个 迭代 器 的 引用 作为 参数 , 完成 交换 工作 并 更 新 有 关 的 和 迭代 器 . 下 面 机 器 
在 交换 了 两 个 对 象 之 后 推进 这 两 个 迭代 器 : 


template<typename IO, typename I1> 
requires(Mutable(IO) && Forwardlterator(IO) && 
Mutable(I1) && ForwardIterator(I1) && 
ValueType(IO) -- ValueType(11)) 
void swap.step(IOE fO, 11& f1) 
1 
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// 前 条 件 : deref(fo) 和 deref(f1) 有 定义 
exchange.values(fO, f1); 
£0 = successor(fO); 


fl = successor (f1); 


这 样 就 得 到 第 一 个 算法 , 它 与 copy 类 似 : 


template<typename IO, typename I1» 
requires(Mutable(IO) && ForwardIterator(IO) && 
Mutable(I1) && ForwardIterator(I1) && 
ValueType(10) == ValueType(11)) 
11 swap.ranges(IO £0, IO 10, I1 f1) 


1 
// Bi & fF: mutable bounded range(fo, lo) 
// BI & fF: mutable counted. range(f;, lo — fo) 
while (fO != 10) swap.step(fO, f1); 
return #1; 

} 


第 二 个 算法 与 copy bounded 类 似 : 


template<typename IO, typename I1» 
requires(Mutable(IO) && ForwardIterator(IO) && 
Mutable(I1) && ForwardIterator(I1) && 
ValueType(IO) == ValueType(11)) 
pairXIO, I1» swap.ranges bounded(IO #0, IO 10, Ii #1, I1 11) 
X 
// B & fF: mutable bounded range(fo, lo) 
// 前 条 件 : mutable bounded range(f;, li) 
while (fO !- 10 &k fi !- 11) swap step(fO, f1); 
return pair<I0, І1>(#0, fl); 


第 三 个 算法 与 copy_n 类 似 : 
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template<typename IO, typename I1, typename N> 
requires(Mutable(IO) && ForwardIterator(IO) && 
Mutable(I1) && ForwardIterator(I1) && 
ValueType(I0) == ValueType(I1) && 


Integer (N)) 

pair<I0, I1> swap_ranges_n(I0 fO, I1 fi, N n) 
1 

// 前 条 件 : mutable counted. range(fo, n) 

// BI & FE: mutable counted. range(f;, n) 

while (count_down(n)) swap. step(fO, fl); 

return pairXIO, І1>(#0, f1); 
} 


如 果 送 给 范围 交换 算法 的 范围 不 重 盈 , 情况 很 清楚 , 上 面 算 法 的 效果 就 是 
交换 了 对 应 位 置 的 各 对 对 象 的 值 . 下 一 章 将 推导 出 存在 重 肥 情况 时 的 后 条 件 . 

反 向 拷贝 的 结果 也 是 得 到 了 一 份 拷贝 , 其 中 的 位 置 与 原 范 围 相 比 是 反 过 来 
的 . 反 向 交换 的 情况 与 此 类 似 . 要 做 反 向 交换 , 需要 有 另 一 机 器 , 它 向 后 推 第 一 
个 范围 , 同时 向 前 推 第 二 个 范围 : 


template<typename 10, typename I1> 
requires(Mutable(IO) && Bidirectionallterator(IO) && 
Mutable(I1) && ForwardIterator(I1) && 
ValueType(IO) == ValueType(11)) 
void reverse swap.step(IO& 10, I1& fl) 


1 
// 前 条 件 : deref(predecessor(19)) 和 deref(f1) 有 定义 
10 = predecessor(10); 
exchange values(10, f1); 
f1 = successor(f1); 
上 


由 于 exchange.values 的 对 称 性 , 只 要 有 一 个 迭代 器 的 类 型 是 双向 的 , 就 可 
以 用 reverse swap_ranges, 不 需要 再 写 另 一 个 反 向 的 版 本 : 
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template<typename 10, typename I1> 
requires(Mutable(IO) && Bidirectionallterator(IO) && 
Mutable(I1) && ForwardIterator(I1) && 
ValueType(I0) == ValueType(I1)) 
11 reverse swap ranges(IO fO, IO 10, I1 fl) 


1 
// 前 条 件 : mutable bounded range(fo, lo) 
// 前 条 件 : mutable-counted_range(f1, lo — fo) 
while (fO != 10) reverse.swap step(10, f1); 
return f1; 

} 


template<typename 10, typename I1> 
requires(Mutable(IO) && Bidirectionallterator(IO) && 
Mutable(Ii) && ForwardIterator(I1) && 
ValueType(I0) == ValueType(I1)) 
pairXIO, Ii»reverse.swap.ranges bounded(IO fO, IO 10, 


Ti fi, IA 11) 

t 

// ВТЗ ТЕ: mutable bounded. range(fo, lo) 

// 前 条 件 : mutable bounded_range([fi, 1) 

while (fO != 10 && fl != 11) 

reverse_swap_step(10, fl); 

return pair<I0, I1>(10, #1); 

} 


template<typename 10, typename Іі, typename N> 
requires(Mutable(IO) && Bidirectionallterator(IO) && 
Mutable(I1) && ForwardIterator(I1) && 
ValueType(I0) == ValueType(I1) && 
Integer (N)) 


раіг<10, I1> reverse_swap_ranges_n(I0 10, I1 #1, N n) 
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// W& fF: mutable counted range(lo — n, n) 

// 前 条 件 : mutable counted.range(f;, n) 

while (count down(n)) reverse. swap step(10, fl); 
return pairXIO, I1>(10, #1); 


9.5 &% 


通过 扩展 迭代 器 类 型 使 之 支持 sink , 带 来 了 可 写 性 和 可 变动 性 . sink 的 公理 很 
简单 , 但 如 果 有 别名 和 并 发 更 新 (本 书 中 没有 讨论 ), 命令 式 程序 设计 也 会 变 得 
非常 复杂 . 特别 是 , 在 定义 前 条 件 使 之 能 处 理 不 同和 迭代 器 类 型 的 别名 时 , 需要 
特别 小 心 . 各 种 拷贝 算法 很 简单 , 功能 强大 , 应 用 也 非常 广泛 . 从 简单 的 机 器 出 
发 组 合 出 这 些 算法 , 能 帮助 我 们 把 这 些 算法 组 织 起 来 , 揭示 出 它们 的 共同 点 , 也 
能 说 明 它们 之 间 的 差异 . 使 用 值 交换 而 不 是 赋值 , 就 得 到 了 一 族 类 似 的 但 可 能 
稍 少 的 范围 交换 算法 , 它们 都 非常 有 用 . 
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重 整 


f 还 要 介绍 一 批 算 法 的 分 类 体系 , 这 些 算法 称 为 
EK, 它们 排列 一 个 范围 里 的 元 素 以 满足 某 个 给 定 的 后 条 件 . 这 里 要 为 双向 和 
随机 访问 选 代 器 提出 一 些 移 代 式 的 反 转 算法 , 为 前 向 选 代 器 提出 一 个 采用 分 
治 方式 的 反 转 算法 . 还 将 展示 如 何 对 该 分 治 算 法 做 一 些 变换 , 使 之 在 能 使 用 额 
外 内 存 的 情况 下 运行 更 快 . 本 章 还 要 描述 针对 不 同 选 代 器 类 型 的 三 个 轮换 算 
法 ,其 中 的 轮换 操作 交换 两 个 相 邻 的 范围 , 这 两 个 范围 可 以 不 一 样 大 . 在 本 章 最 
后 还 将 讨论 如 何 基 于 不 同 算法 的 需求 , 将 它们 打包 为 在 编译 时 选择 的 算法 . 


10.1 置换 


变换 f 是 内 变换 (into transformation), 如 果 对 其 定义 空间 里 任意 的 x, 都 存在 定 
义 空间 里 的 y E y = f(x). f ÆRE (onto transformation), 如 果 对 其 定义 空间 
里 任意 的 y, 都 存在 定义 空间 里 的 某 个 x 使 y=flx).f 是 一 一 变换 (one-to-one 
transformation), 如 果 对 其 定义 空间 里 任意 的 x, x”, f(x) = f(x") 9 x = x'. 


引 理 10.1 有 穷 定义 空间 上 的 f 是 满 变 换 , 当 且 仅 当 它 既 是 内 变换 也 是 一 一 变 
5. 


练习 10.1 请 找 出 自然 数 上 的 一 个 变换 , 它 既 是 内 变换 又 是 满 变 换 , 但 却 不 是 一 
一 变换 ; 以 及 一 个 既 内 又 一 一 的 , 但 却 非 满 的 变换 . 


满足 f(x) = x 的 元 素 x 称 为 变换 f 的 不 动 点 (fixed point). FRR 
(identity transformation) 是 以 其 定义 空间 里 的 每 个 元 素 为 不 动 点 的 变换 . 下 面 
将 用 identity, 表示 集合 5 上 的 恒 等 变 换 . 
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Ж.Ж (permutation) 就 是 有 限定 义 空间 上 的 满 变换 . 下 面 是 [0,6) 上 的 一 个 
置换 实例 : 
p(0) =5 
p(1) =2 
p(2) = 4 
p(3) =3 
p(4) =1 
(5) =0 
WR р 和 q 是 集合 S 上 的 两 个 置换 , 它们 的 复合 (composition), 记 为 o p, 
YE x € S 变 到 а(р(х)). 
引 理 10.2 置换 的 复合 还 是 置换 . 
引 理 10.3 置换 的 复合 运算 是 可 结合 的 . 
引 理 10.4 对 于 集合 S 上 的 每 个 置换 p, 都 存在 其 北 置 换 (inverse of permutation) 
p^! IE p! op =pop = identity,. 
一 个 集合 上 的 所 有 置换 在 复合 下 形成 一 个 群 (permutation group). 
引 理 10.5 任何 有 和 穷 群 都 是 其 元 素 的 置换 群 的 一 个 子 群 , 这 一 子 群 里 的 一 个 置 
换 通过 用 群 中 的 一 个 元 素 乘 以 其 他 各 元 素 生成 . 
例如 , 模 5 乘法 群 有 下 面 的 乘法 表 : 


s = x 


1 

1 

2 

3/3 

4|4 

这 一 乘法 表 里 的 每 一 行 或 一 列 都 是 一 个 置换 . 易 见 并 不 是 4 个 元 素 上 的 4! = 24 
个 置换 都 在 这 个 群 里 , 因此 模 5 的 乘法 群 是 四 个 元 素 的 置换 群 的 一 个 真子 群 . 

一 个 环 路 (cycle) 就 是 置换 中 的 一 条 环形 轨道 . 平凡 环 路 (trivial cycle) 指 规 

模 为 1 的 环 路 ; 每 个 平凡 环 路 中 的 元 素 都 是 相应 置换 的 不 动 点 . 包含 恰好 一 个 








SEHER 
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非 平凡 环 路 的 置换 称 为 一 个 循环 置换 (cyclic permutation). 对 换 (transposition) 
是 具有 规模 为 2 的 环 路 的 循环 置换 . 
引 理 10.6 置换 中 的 每 个 元 素 属于 唯一 的 一 个 环 路 . 
引 理 10.7 n 元 集合 上 的 任 一 置换 包含 k<n 个 环 路 . 
引 理 10.8 不 相交 的 循环 置换 可 以 交换 . 
练习 10.2 请 给 出 一 个 例子 , 其 中 有 两 个 相交 的 循环 置换 , 它们 不 可 交换 . 
引 理 10.9 每 个 置换 都 能 表示 为 与 它 的 环 路 对 应 的 所 有 循环 置换 的 乘积 . 
引 理 10.10 一 个 置换 的 逆 是 其 各 个 环 路 的 逆 的 乘积 . 
引 理 10.11 每 个 循环 置换 都 是 一 些 对 换 的 乘积 . 
引 理 10.12 每 个 置换 都 是 一 些 对 换 的 乘积 . 
规模 为 n 的 有 穷 集 (finite set) 5 是 一 个 集合 , 对 它 存 在 一 对 函数 


chooses : [0, n) — 5 


index, : S — [0, n) 
满足 


chooses (indexs(x)) = x 


indexs(chooses(i)) =i 


换 句 话说 , S 可 与 自然 数 的 一 个 区 间 建 立 一 一 对 应 . 
ШЖ p 是 规模 为 n 的 有 穷 集 S 的 一 个 置换 , 那么 存在 [0,n) 上 对 应 的 索引 
ER p, 定义 如 下 


p’(i) = indexs(p(chooses(i))) 
引 理 10.13 p(x) = chooses(p’(indexs(x))) 


下 面 经 常用 对 应 的 索引 置换 来 定义 集合 上 的 置换 . 


Download at htip: / /www pinSi.com, 
182 98 10 X BS 


10.2 £# 


— ` 3 (rearrangement) 是 一 个 算法 , 它 把 一 个 输入 范围 里 的 元 素 拷贝 到 一 
个 输出 范围 , 使 这 一 对 输入 和 输出 范围 之 间 的 索引 映射 是 一 个 置换 . 本 章 研究 
基于 位 置 的 (position-based) 重 整 , 其 中 一 个 值 的 目标 位 置 只 依赖 于 它 原来 的 位 
置 而 不 依赖 于 它 的 值 . 下 一 章 将 研究 基于 谓词 的 (predicate-based) JE, 在 那 
里 一 个 值 的 目标 位 置 只 依赖 于 将 一 个 谓词 作用 于 该 值 的 结果 ; 还 有 基于 序 的 
(ordering-based) 重 整 , 其 中 一 个 值 的 目标 位 置 仅 依赖 于 值 之 间 的 顺序 关系 . 


第 8 章 研究 了 链接 的 重 整 , 例如 reversetinked, 其 中 通过 修改 链接 完成 重 整 
THE. 第 9 章 研 究 了 拷贝 重 整 , 例如 copy 和 reverse_copy. 本 章 和 下 一 章 将 研究 
变动 型 重 整 , 其 中 的 输入 和 输出 是 同一 个 范围 . 


每 一 个 变动 型 重 整 都 对 应 于 两 个 置换 : 一 个 去 置换 (to permutation), 它 把 
一 个 迭代 器 i 映射 到 指向 原本 在 i 的 元 素 的 目标 位 置 的 迭代 器 ; 还 有 一 个 回 置 
# (from permutation), 它 将 迭代 器 i 映射 到 指向 被 移 到 了 i 的 元 素 的 原来 位 置 
的 那个 迭代 器 . 














引 理 10.14 一 个 重 排 的 去 置换 和 回 置 换 互 逆 . 
如 果 去 置换 已 知 , 那么 就 可 以 用 下 面 算 法 重 整 一 个 环 路 : 


template<typename I, typename F> 
requires(Mutable(I) && Transformation(F) && I == Domain(F)) 
void cycle.to(I i, F f) 
{ 
// 前 条 件 :i 在 f 下 的 执 道 是 环 路 
// 前 条 件 : (Vn Є N) deref(t^(1)) 有 定义 
Ik = #(1); 
while (k != i) í 
exchange values(i, К); 
k = f(k); 
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EDT cycletoli,f) 之 后 , 对 于 站 在 f 下 的 轨道 上 的 所 有 和 迭代 器 j 都 有 
source(f(j)) 的 值 与 source(j] 的 原 值 相等 . 对 规模 为 n 的 环 路 , 这 一 调用 将 执行 
3(n — 1) KRE. 


练习 10.3 请 实现 cycle to 的 一 个 版 本 , 它 只 需 做 2n — 1 次 赋值. 
如 果 回 置换 已 知 , 可 以 用 下 面 算法 重 整 一 个 环 路 : 














template<typename I, typename F> 
requires(Mutable(I) && Transformation(F) && I == Domain(F)) 
void cycle from(I i, F f) 
+ 
// 前 条 件 :i 在 f FREER 
// 前 条 件 : (vn € N) deref(^(1)) 有 定义 
ValueType(I) tmp = source(i); 
Іј= і; 
Ik = #(1); 
while (k != i) ( 
sink(j) = source(k); 
jak 
k = f(k); 
} 
sink(j) = tmp; 


在 执行 了 cycle-from(i,f) 之 后 , 对 于 i 在 f 的 轨道 上 的 所 有 和 迭代 器 让， 
source(j) 的 值 和 source(f(j)) 的 原 值 相等 . 这 个 调用 执行 n+1 次 赋值 , 而 如 
果 用 exchange values 实现 它 , 就 需要 执行 3(n 一 1) 次 赋值 . 可 以 看 到 , 这 里 只 要 
求 类 型 1 上 的 可 修改 性 . 而 且 不 需要 任何 遍历 函数 , 因为 变换 f 执行 了 有 关 的 
遍历 . 除了 回 置 换 外 , 利用 сусе пот 实现 修改 型 重 整 还 需要 有 一 种 方式 取得 
每 个 环 路 的 代表 元 . 在 一 些 实际 情况 下 , 环 路 的 结构 及 其 代表 元 是 已 知 的 . 


练习 10.4 请 实现 一 个 算法 , 它 完成 一 个 索引 迭代 器 的 范围 里 的 一 次 任意 重 整 . 
请 用 一 个 包含 n 个 布尔 值 的 数组 来 标记 已 经 重新 置 位 的 元 素 , 扫描 该 数组 找 
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未 标记 的 元 素 , 通过 这 种 方法 确定 下 一 个 环 的 代表 元 . 
练习 10.5 假设 欠 代 器 有 一 个 全 序 , 请 设计 一 个 算法 , 它 只 需 常量 空间 就 可 以 确 
定 某 迭 代 器 是 否 为 一 个 环 的 代表 元 . 利用 这 一 算法 实现 一 个 任意 重 整 算法 . 


引 理 10.15 给 定 了 一 个 回 置换 , 有 可 能 通过 m+ cn 一 cr 次 赋值 完成 一 次 变动 型 
重 整 , 这 里 的 n 是 元 素 个 数 , cy 是 非 平 凡 环 的 个 数 , 而 cr 是 平凡 环 的 个 数 . 


10.3 反 转 算法 


一 种 简单 而 且 有 用 的 变动 型 重 整 是 范围 的 反 转 (reverse). 这 种 重 整 由 n 元 有 穷 
集合 上 的 反 转 置换 导出 , 集合 上 的 反 转 置换 基于 其 索引 置换 定义 如 下 


pli) = (n—1)-i 
引 理 10.16 在 一 个 反 转 置换 里 , 非 平凡 环 有 [n/2] 4; 平凡 环 有 n mod 2 个 . 
引 理 10.17 在 一 个 置换 里 最 多 有 1/2] 个 非 平 凡 环 . 
反 转 的 概念 直接 由 索引 迭代 器 上 的 下 面 算法 定义 :1 
template<typename I> 
requires(Mutable(I) && IndexedIterator(I)) 
void reverse n indexed(I f, DistanceType(I) n) 
1 
// BI & fF: mutable counted range(f, n) 
DistanceType(I) i(0); 
n = predecessor(n); 
while (i < n) { 
// n = (Moriginat — 1) —i 
exchange values(f + i, f + n); 


i = successor(i); 





1. 反 转 算法 也 可 以 返回 其 中 不 移动 的 元 素 的 范围 : 当 整 个 范围 中 元 素 个 数 为 奇数 时 返回 中 间 
TR, 元 素 个 数 为 偶数 时 返回 两 个 “中 间 " 元 素 之 间 的 空 范围 . 由 于 还 没有 看 到 需要 利用 这 种 
返回 值 的 实际 情况 , 因此 这 里 返回 的 是 void. 当然 , 对 于 以 前 向 迭代 器 的 计数 范围 为 参数 的 版 
本 , 返回 其 极限 是 很 有 用 的 . 
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n = predecessor(n) ; 


如 果 把 这 个 算法 用 于 前 向 或 者 双向 迭代 器 , 它 将 执行 平方 次 数 的 迭代 器 增 
量 运算 . 对 于 双向 迭代 器 , 每 次 迭代 需要 做 两 次 检测 : 


template<typename I> 
requires(Mutable(I) && Bidirectionallterator(I)) 
void reverse.bidirectional(I f, I 1) 
t 
// 前 条 件 : mutable_bounded_range(f,1) 
while (true) { 
if (f == 1) return; 
1 = predecessor(1) ; 
if (f == 1) return; 
exchange.values(f, 1); 


f = successor(f); 


如 果 范 围 的 规模 已 知 , 就 可 以 用 reverse swap-ranges.n: 


template<typename I> 

requires(Mutable(I) && Bidirectionallterator(I)) 
void reverse. n bidirectional(I f, I 1, DistanceType(I) n) 
t 

// 前 条 件 : mutable bounded_range(f,1) ЛО < n < l- f 


reverse swap.ranges n(l, f, half nonnegative(n)); 


reverse swap.ranges.n 的 前 两 个 实 参 的 顺序 根据 下 面 事实 确定 : 算法 要 在 第 
一 个 范围 里 反 向 运动 . 把 mn< 1 一 f 送 给 reverse. n.bidirectional, 使 位 于 中 间 的 值 
留 在 原 位 . 
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如 果 一 种 数据 结构 提供 的 是 前 向 迭代 器 , 例如 链接 迭代 器 , 自然 可 以 用 
reverse. linked. 如 果 一 些 情况 中 有 可 用 的 额外 存储 , 可 以 采用 下 面 算法 : 


template<typename I, typename B> 
requires(Mutable(I) && ForwardIterator(I) && 
Mutable(B) && Bidirectionallterator(B) && 
ValueType(I) == ValueType(B)) 
I reverse n with buffer(I f.i, DistanceType(I) n, В f-b) 
{ 
// 前 条 件 : mutable.counted.range(f;, n) 
// 前 条 件 : mutable-counted_range(f,,n) 
return reverse copy(f.b, copy.n(f.i, n, f.b).mi, f.i); 


y 


reverse_n_with_buffer 要 执行 2n 次 赋值 . 
下 面 一 些 重 整 中 用 了 这 种 方法 , 先 把 信息 拷贝 一 个 缓存 , 然后 再 拷贝 回来 . 
如 果 没 有 可 用 的 缓存 , 但 是 在 栈 空间 存在 着 对 数 规模 的 存储 , 可 以 用 
一 个 分 治 法 算法 : 把 被 处 理 范围 划分 为 两 个 部 分 , 先 反 转 每 个 部 分 , 然后 用 
swap.ranges.n 交换 这 两 个 部 分 . 


引 理 10.18 把 划分 做 得 尽 可 能 平均 就 能 最 大 限度 地 减少 工作 量 . 


如 果 让 算法 返回 极限 值 , 就 可 以 采用 一 种 称 为 递归 中 辅助 计算 的 技术 , 来 
优化 到 中 点 的 遍历 : 


template<typename I> 

requires(Mutable(I) && ForwardIterator(I)) 
І reverse.n forward(I f, DistanceType(I) n) 
t 

// 前 条 件 : mutable_counted_range(f, n) 

typedef DistanceType(I) N; 

if (n < N(2)) return f + n; 

N h = half nonnegative(n); 

N nmod2 = n - twice(h); 


І m = reverse п forward(f, h) + n mod 2; 
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I 1 = reverse n forward(m, h); 
swap.ranges.n(f, m, h); 


return 1; 


reverse. n.forward 的 正确 性 依赖 于 下 面 事实 . 
引 理 10.19 [0,n) 上 的 反 转 置换 是 唯一 的 一 个 满足 i<j > pli) < pli) MER. 


显然 本 条 件 对 规模 为 1 的 范围 成 立 . 递归 调用 对 每 个 半 区 归纳 建立 这 一 条 
件 . 半 区 之 间 , 以 及 可 能 跳 过 的 中 间 元 素 之 间 的 条 件 成 立 由 swap-ranges.n 保证 . 


引 理 10.20 FKEA n= LU ai2: 的 范围 , 其 中 at Ж n 的 二 进 制 表示 的 
第 + 个 二 进 制 位 , 赋值 的 总 次 数 是 3 OE auos 


reverse.n.forward 需要 对 数 规模 的 调用 栈 空 间 ， 一 个 具有 存储 适应 性 
(memory-adaptive) 的 算法 能 利用 其 可 能 获得 的 尽 可 能 多 的 附加 空间 得 到 
最 好 的 性 能 , 并 能 通过 不 多 的 附件 空间 获得 很 大 性 能 改进 , 由 这 种 想法 得 到 
了 下 面 的 算法 , 它 使 用 分 治 法 , 并 在 子 问 题 可 以 放 入 缓存 时 转 到 线性 时 间 算 法 


reverse_n_with_buffer: 

















template<typename I, typename B> 
requires(Mutable(I) && ForwardIterator(I) && 
Mutable(B) && Bidirectionallterator(B) && 
ValueType(I) == ValueType(B)) 
I reverse.n.adaptive(I f.i, DistanceType(I) ni, 
B f.b, DistanceType(I) n_b) 


// 前 条 件 : mutable counted range(f,, n.) 
// ВТЗ fF: mutable counted range(f,, ть) 
typedef DistanceType(I) N; 
if (ni « N(2) 

return fi + ni; 
if (ni <= nb) 


return reverse n vith buffer(f i, пі, f_b); 
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N hi = half nonnegative(n і); 

N n mod.2 = ni - twice(h_i); 

I mi = reverse.n.adaptive(f.i, hi, f b, n b) + n mod.2; 
I Li = reverse n_adaptive(m-i, hi, f b, nb); 
swap_ranges_n(f_i, mi, hi); 

return li; 


y 


练习 10.6 请 针对 给 定 的 范围 和 缓存 的 规模 推导 出 一 个 数学 公式 , 描述 
reverse. n.adaptive 执行 赋值 的 总 次 数 . 


10.4 轮换 算法 
由 索引 置换 pli) = (1+ к) mod n 定义 的 n THR p 称 为 一 个 k- 轮 换 (rotation). 
引 理 10.21 一 个 m 元 kx 轮换 的 逆 是 一 个 (n 一 k)- 轮 换 . 

索引 为 i 的 元 素 在 环 


(i, (i+ k) mod n, (i+ 2k) mod n,...) = {(i + uk) mod n) 
里 . 该 环 的 长 度 是 满足 下 式 的 最 小 正 整 数 m 
i= (1+ тк) mod n 


这 等 价 于 mk mod n = 0, 说 明 环 的 长 度 与 i 无 关 . HF m 是 满足 mk mod n = 0, 
lem(k, n) = mk 的 最 小 正 整数 (lem(a,b) Ж а 和 的 最 小 公 倍数 ). 利用 标准 等 
式 


lem(a, b) gcd(a, b) = ab 
就 可 以 得 到 环 的 规模 


lem(kn) _ kn _ n 
|. k &gd(kn)k gcd(k,n) 





因此 环 的 个 数 是 gcd(k, п). 
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考虑 一 个 环 中 两 个 元 素 (i + uk) mod n 和 (i+ vk) mod n. 它们 的 距离 是 


|(i + uk) mod n — (i + vk) mod n| = (u — v)k mod n 


=(u-—v)k—pn 


这 里 有 p = quotient((u — v)k n). KA k 和 nm MR а = ged(k,n) 整除 , 所 以 该 距 
离 也 被 a 整除 . 由 此 可 知 , 一 个 环 上 不 同 元 素 之 间 的 距离 至 少 是 a, 因此 索引 为 
[0, a) 的 元 素 属于 不 同 的 环 . 

范围 [f,1) 中 的 k- 轮 换 重 整 等 价 于 交换 子 范围 [6,m) 和 [m, U) 里 相应 位 置 的 
各 对 值 , 其 中 m=f+((L-1f —k) =1—k. m 是 比 k 更 有 用 的 输入 . 如 果 涉及 的 
是 前 向 或 双向 迭代 器 , 有 了 它 就 可 以 避免 再 通过 线性 次 操作 从 k 算 出 m. 返回 
迭代 器 m = t + k 指明 了 位 于 f 的 元 素 的 新 位 置 , 这 对 许多 算法 也 很 有 用 .2 


引 理 10.22 围绕 迭代 器 m 做 范围 [f,1) 的 轮换 , 而 后 围绕 返回 值 m 做 轮换 , 将 
会 返回 m 并 将 该 范围 恢复 到 它 原来 的 状态 . 


可 以 用 cyclefrom 实现 一 个 索引 迭代 器 或 随机 访问 和 迭代 器 范围 的 k- 轮 换 重 
W. 这 时 去 置换 是 p(i) = (i+k) mod n, A BME IM 5 71 (i) = (i+(n—k)) mod n, 
REH n —k =m —- f. 我 们 希望 避免 计算 mod, 而 且 可 以 看 到 


in i+(n—k) ifi<k 
p (0) = 
i-k ifi>k 


这 样 就 得 到 了 下 面 这 个 能 用 于 随机 访问 迭代 器 的 函数 对 象 : 


template<typename I> 

requires (RandomAccessIterator(I)) 
struct k rotate from permutation random access 
1 

DistanceType(I) k; 

DistanceType(I) n minus k; 


I mprime; 





2. Joseph Tighe 建议 返回 一 对 值 m M m^; 以 便 构造 出 一 个 合法 范围 ; 尽管 这 是 一 个 有 趣 的 建 
议 , 它 保留 了 所 有 相关 信息 , 但 我 们 还 没有 看 到 这 种 接口 的 有 价值 应 用 . 
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k.rotate from permutation.random access(I f, I m, I 1) : 
k(1 - m), n minus k(m - f), m prime(f + (1 - m) 


t 
// ВЕЗЕ: bounded_range(f, 1) A m c [f, 1) 
$ 
I operator()(I x) 
1 
// WEE: x € [60 
if (х < mprime) return x + n minus к; 
else return x - k; 
} 


ЖОКЕ, 由 于 缺乏 自然 的 序 , 从 一 个 迭代 器 减 去 一 个 距离 要 多 做 一 
次 或 两 次 加 法 : 


template<typename I> 
requires (IndexedIterator(I)) 
struct k rotate from permutation indexed 
t 
DistanceType(I) k; 
DistanceType(I) n minus k; 
Y +; 
k.rotate from permutation indexed(I f, I m, I 1) : 
k(1 - m), n minus k(m - f), f(f) 


t 
// B & fF: bounded_range(f,1) A m € [f,1) 
了 
I operator()(I x) 
1 


// WAH: x € 6,1) 


DistanceType(I) i = x - f; 
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if (i < k) return x + n.minus.k; 


else return f * (i - k); 


下 面 过 程 对 每 个 环 做 一 次 轮换 : 


template<typename I, typename F> 

requires(Mutable(I) && IndexedIterator(I) && 
Transformation(F) && I == Domain(F)) 

I rotate.cycles(I f, I m, I 1, F from) 

t 
// ВТЗ ФЕ: mutable_bounded_range(f, 1) ^ m € [f,1] 
// BEA TE: from Æ (6,1) 上 的 去 置换 
typedef DistanceType(I) N; 
N d = gcd<N, N>(m - f, 1 - m; 
while (count_down(d)) cycle_from(f + d, from); 
return f + (1 - m); 


本 算法 最 早 发 表 在 Fletcher and Silver [1966], 但 在 上 面 用 cycle.from 的 地 方 
他 们 用 的 是 cycle to. 这 些 过 程 能 正确 选择 合适 的 函数 对 象 ; 


template<typename I> 
requires(Mutable(I) && IndexedIterator(I)) 


I rotate indexed nontrivial(I f, I m, I 1) 


t 
// ВТЗ fF: mutable bounded_range(f,1) Af < m < 1 
k_rotate_from_permutation_indexed<I> p(f, m, 1); 
return rotate cycles(f, m, 1, p); 

} 


template<typename I> 


requires(Mutable(I) && RandomAccessIterator(I)) 
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I rotate random access. nontrivial(I f, I m, I 1) 


t 
// 前 条 件 : mutable bounded. range(f, 1) Af < m <1 
k rotate from permutation random access<I> p(f, m, 1); 
return rotate-cycles(f, m, 1, p); 

} 


这 里 赋值 的 次 数 是 n+cn 一 cr =n 十 gcd(n,k). 再 说 一 下 , n 是 元 素 个 数 ,cn 
是 非 平凡 环 的 个 数 , 而 cr 是 平凡 环 的 个 数 . 对 于 1 < mk < m, ged(n,k) 的 期 望 
值 是 Inm + C + OE) (GF Diaconis and Erdós [2004)). 

下 面 性 质 引 出 了 一 个 用 于 双向 选 代 器 的 轮换 算法 . 


引 理 10.23 [0,n) 上 的 -轮换 是 唯一 满足 下 面条 件 的 置换 p: 它 能 逆转 子 范围 
[0,n 一 k) 和 [n — k,n) 的 相对 顺序 , 但 维持 每 个 子 范围 内 部 的 相对 顺序 : 


1. і<п- КАп-к<ј <п > plj) < pli) 
2.i«j«n—-kVn-k«&i«j- pli) < plj) 


反 转 置换 满足 1 但 不 满足 2. 将 反 转 应 用 于 [0,n — k) 和 [n 一 k,n), 然后 再 
将 反 转 应 用 于 整个 范围 , 就 能 同时 满足 两 个 条 件 : 


reverse_bidirectional(f, m); 
reverse_bidirectional(m, 1); 


reverse_bidirectional(f, 1); 
可 以 看 到 , 返回 值 m^ 可 以 用 reverse.swap.ranges bounded 得 到 :3 


template<typename I> 
requires(Mutable(I) && Bidirectionallterator(I)) 
I rotate bidirectional nontrivial(I f, I m, I 1) 
t 
// Bi & fF: mutable_bounded_range(f, 1) Af < т <1 
reverse_bidirectional(f, m); 


reverse_bidirectional(m, 1); 





3. А reverse swap_ranges_bounded 去 确定 m” Ж Wilson Ho 和 Raymond Lo 的 建议 . 
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pair<I, I> р = reverse_swap_ranges_bounded(m, 1, f, m); 
reverse bidirectional(p.mi, p.m0); 

if (m == p.mO) return p.mi; 

else return p.m0; 


} 


3138 10.24 赋值 次 数 是 3(|n/2| + [k/2] + (п – 0)/2]). 当 n 和 k 都 是 偶数 时 也 
就 是 Зп, 否则 是 3(n — 1). 


给 定 范围 [f,1) 和 该 范围 里 的 迭代 器 m, 调用 
p — swap.ranges.bounded(f, m, m, 1) 
Жр 设置 为 一 对 迭代 器 , 使 得 
p.m0 =т\/р.т1 =l 


WR p.m0 = m Ap.m1 = t, 事情 就 做 完了 . 否则 [f,p.m0) 已 经 在 最 终 位 置 , 还 要 
根据 p.m0 =m RÆ paml =1 决定 对 pp.m0,U 分 别 围绕 p.ml 或 者 т 做 轮换 . 这 
样 立 刻 就 得 到 了 下 面 算 法 , 它 最 早出 现在 Gries and Mills [1981]: 


template<typename I> 
requires(Mutable(I) && ForwardIterator(I)) 
void rotate forward_annotated(I f, I m, I 1) 
1 
// 前 条 件 : mutable bounded. range(f, 1) Af < m «1 
DistanceType(I) a = m - f; 
DistanceType(I) b = 1 - m; 
while (true) { 
pair<I, I> p = swap_ranges_bounded(f, m, m, 1); 
if (p.mO == m && p.mi == 1) { assert(a == b); 
return; 
} 
f = p.n0; 
if (f == ш) { assert(b > a); 
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m = p.mi; b=b-a; 
) else { assert(a > b); 
а =a - b; 
} 
} 
} 


引 理 10.25 第 一 次 取 到 else FAM f =m’, 这 是 轮换 的 标准 返回 值 . 


标注 变量 (annotation variable) a 和 b 总 等 于 被 交换 的 两 个 子 范围 的 规模 , 
同时 用 减法 求 初始 规模 的 рса. swap. ranges. bounded 每 次 执行 exchange. values 把 
一 个 值 放 入 其 最 终 位 置 ; 最 后 一 次 调用 swap. ranges. bounded 的 情况 不 同 . 每 调 
用 exchange_values 一 次 将 两 个 值 放 入 最 终 位 置 . 由 于 swap ranges bounded 的 最 
后 调用 执行 ged(n, к) 次 对 exchange-values 的 调用 , 对 exchange.values 总 调用 次 
Ж n — ged(n, k). 

上 面 引 理 也 提出 了 一 种 实现 完整 的 rotate forward 的 方法 : 建立 代码 的 第 二 
份 拷贝 , 在 else 子 句 里 保存 f 的 一 份 拷 贝 , 而 后 调用 rotate forward annotated 去 
完成 轮换 . 由 这 些 想法 可 以 得 到 下 面 两 个 过 程 : 


template<typename I> 
requires(Mutable(I) && ForwardIterator(I)) 
void rotate forward step(I& f, I& m, I 1) 


t 
// 前 条 件 : mutable_bounded_range(f, 1) Af < m < 1 
I c = m; 
do { 
swap_step(f, c); 
if (f == m) m = c; 
} while (c != 1); 
k 


template<typename I> 


requires(Mutable(I) && ForwardIterator(I)) 
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I rotate forward nontrivial(I f, I m, I 1) 


t 
// 前 条 件 : mutable bounded_range(f,1) Af < m < 1 
rotate forward step(f, m, 1); 
I m prime = f; 
while (m != 1) rotate forward step(f, m, 1); 
return m prime; 

} 


练习 10.7 请 验证 rotate_forward_nontrivial 能 围绕 m 做 [f, 1) 的 轮换 并 返回 m”. 


有 时 做 一 个 范围 的 部 分 轮换 (partially rotate) 也 很 有 用 , 即 , 在 对 原 位 于 
Hf, m) 的 对 象 做 重 整 时 把 正确 元 素 移 到 (е, m), 但 维持 [m 1) 不 变 . 例如 , 这 种 操 
作用 于 把 一 些 不 要 的 对 象 移 到 序列 末端 准备 删除 . 下 面 算 法 完成 这 一 工作 : 


template<typename I> 
requires(Mutable(I) && ForwardIterator(I)) 
I rotate_partial_nontrivial(I f, I m, I 1) 
{ 
// ВТЗ fF: mutable bounded. range(f, 1) Af < т <1 
return swap.ranges(m, 1, f); 


} 


引 理 10.26 rotate_partial_nontrivial 的 后 条 件 说 明 它 执行 的 是 部 分 轮换 , 对 位 于 
[m/, t) 的 对 象 做 k- 轮 换 , 这 里 的 k= 一 (1 一 {) mod (m — f). 


rotate_partial_nontrivial 的 反 向 版 本 里 使 用 swap-ranges 的 反 向 版 本 , 该 算法 
有 时 也 很 有 用 . 
如 果 有 额外 的 存储 可 用 , 就 可 能 使 用 下 面 算 法 : 


template<typename I, typename B> 
requires(Mutable(I) && ForwardIterator(I) && 
Mutable(B) ёё ForwardIterator(B)) 
I rotate_with_buffer_nontrivial(I f, I m, I 1, B f b) 
1 
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// 前 条 件 : mutable. bounded. range(f, U Af < m «1 
// 前 条 件 : mutablecounted_range(f,, l — f) 

B 1-b = copy(f, m, fb); 

Imprime = copy(m, 1, f); 

copy(f.b, l.b, m prime); 


return m prime; 


rotate with. buffer nontrivial 需要 执行 (L— f) + (m — f) 次 赋值 , 而 下 面 的 算法 
只 执行 (6—4) + (L— m) 次 赋值 . 在 对 一 个 双向 迭代 器 范围 做 轮换 时 , 可 以 选择 
使 赋值 数目 达到 最 小 的 算法 . 当然 , 在 运行 时 计算 相关 的 差 需 要 执行 线性 次 的 


successor 运算 : 


template<typename I, typename B> 
requires(Mutable(I) && Bidirectionallterator(I) && 
Mutable(B) && ForwardIterator(B)) 


І rotate_with_buffer_backward nontrivial(I f, I m, I 1, B f b) 
t 
// BI & fi: mutable_bounded_range(f,l) Af <m < 1 
// 前 条 件 : mutable_counted_range(f,,, 1 — f) 
. В l.b = copy(m, 1, f.b); 
copy-backvard(f, m, 1); 
return copy(f.b, lb, f); 


10.5 算法 选择 


在 第 10.3 WH, 针对 不 同 的 迭代 器 需求 和 过 程 原型 给 出 了 几 个 不 同 的 反 转 算 
法 , 包括 一 些 处 理 计数 或 有 界 范围 的 版 本 . 针对 其 他 和 迭代 器 类 型 定义 各 种 变形 ， 
其 中 采用 最 方便 的 原型 也 很 值得 去 做 . 例如 , 另 一 种 常量 时 间 的 选 代 器 减 运算 
提示 我 们 写 出 下 面 的 算法 , AT RRS BRN A FR: 





Download at htip: // were pinSi.com, 
10.5 算法 选择 197 


template<typename I> 

requires(Mutable(I) && IndexedIterator(I)) 
void reverse_indexed(I f, I 1) 
f 

// 前 条 件 : mutable bounded. range(f, 1) 


reverse.n indexed(f, 1 - f); 


如 果 要 反 转 的 是 一 个 前 向 迭代 器 范围 , 通常 会 有 足够 的 可 用 存储 , 使 
reverse_n_adaptive 能 高 效 工 作 . 如 果 要 反 转 的 范围 规模 适中 , 有 可 能 通过 常规 方 
式 获 得 这 种 存储 (例如 用 malloc). 当然 , 如 果 范 围 的 规模 很 大 , 可 能 就 不 存在 足 
够 的 物理 存储 器 来 支持 足够 大 的 缓冲 区 了 . 由 于 reverse.n_adaptive 一 类 算法 在 
缓冲 区 与 被 修改 的 范围 相 比 很 小 的 情况 下 也 能 有 效 工作 , 提供 一 种 方式 来 分 
配 临 时 缓冲 区 (temporary buffer) 是 很 有 意义 的 . 这 一 分 配 得 到 的 存储 可 能 小 
于 所 请 求 的 存储 . 在 有 虚 存 的 系统 里 , 被 分 配 内 存 有 特定 的 物理 内 存 . 这 种 临 
时 内 存 只 准备 用 很 短 时 间 , 而 且 保 证 在 算法 终止 前 交 回 . 

举 个 例子 , 下 面 算法 用 了 类 型 为 temporary_buffer 的 临时 缓冲 区 : 





template<typename I> 
requires(Mutable(I) && ForwardIterator(I)) 
void reverse_n_with_temporary_buffer(I f, DistanceType(I) n) 
{ 
// Bi á fF: mutable.counted.range(f, n) 
temporary_buffer<ValueType(I)> b(n); 


reverse.n adaptive(f, n, begin(b), size(b)); 


构造 函数 b(n) 分 配 内 存 , 用 于 保存 m < n 个 类 型 为 ValueType(1) 的 相 邻 对 
&; size(b) 返回 数 m, 而 begin(d) 返回 指向 这 一 范围 起 始 位 置 的 迭代 器 . b 的 析 
构 函 数 释放 这 块 内 存 . 

针对 同一 个 问题 , 经 常 存在 能 很 好 处 理 不 同 种 类 的 需求 的 多 种 不 同 算法 . 
例如 , 对 于 轮换 有 三 种 有 用 算法 , 分 别处 理 索引 (和 随机 访问 ) 迭代 器 、 双 向 从 
代 器 和 前 向 迭代 器 . 有 可 能 基于 对 类 型 的 需求 , 在 一 族 算法 中 自动 选择 一 个 算 
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法 . 我 们 完成 这 一 工作 时 采用 一 种 称 为 概念 分 发 (concept dispatch) 的 方法 . 下 
面 从 高 层 分 发 过 程 的 定义 开始 , 其 中 也 处 理 了 一 些 平凡 轮换 : 
template<typename I> 


requires(Mutable(I) && ForwardIterator(1)) 
І rotate(I f, Im, I 1) 


£ 

// BW & fF: mutable bounded_range(f,1) A m € [f, J 

if (m == f) return 1; 

if (m == 1) return f; 

return rotate nontrivial(f, m, 1, IteratorConcept(I)()); 
} 


类 型 函数 lteratorConcept 返回 概念 标志 类 型 (concept tag type), 该 类 型 编 
码 了 相应 函数 的 参数 能 建 模 的 最 强 概念 . 在 此 之 后 就 可 以 为 每 个 概念 标志 类 
型 实现 一 个 过 程 : 


template<typename I> 

requires(Mutable(I) ёё ForwardIterator(I)) 
I rotate nontrivial(I f, I m, I 1, forward iterator tag) 
T 

// tt & fF: mutable bounded range(f,l) Af < m «1 


return rotate forward nontrivial(f, m, 1); 


template«typename I» 

requires(Mutable(I) && Bidirectionallterator(I)) 
I rotate.nontrivial(I f, I m, I 1, bidirectional iterator tag) 
1 

// WI & fF: mutable bounded. range(f,l) A f т <1 


return rotate bidirectional nontrivial(f, m, 1); 


template<typename I> 
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requires(Mutable(I) && IndexedIterator(I)) 
I rotate.nontrivial(I f, I m, I 1, indexed iterator tag) 
1 

// 前 条 件 : mutable bounded range(f,l) ^ f < m «1 


return rotate indexed nontrivial(f, m, 1); 


template<typename I> 

requires(Mutable(I) && RandomAccessIterator(I)) 
I rotate.nontrivial(I f, I m, I 1, random access iterator tag) 
1 

// BI & fF: mutable_bounded-_range(f,1) Af < m <1 


return rotate random access. nontrivial(f, m, 1); 


在 概念 分 发 的 定义 中 , 并 没有 考虑 除 概念 需求 之 外 的 其 他 因素 . 例如 , 如 
Ж 10.1 中 总 结 的 , 存在 着 三 个 算法 , 它们 都 能 实现 随机 访问 迭代 器 范围 的 轮 
Ж, 不 同 算法 执行 赋值 的 次 数 不 同 . 如 果 被 轮换 的 范围 可 以 放 入 缓存 , 执行 
n + ged(n, k) 次 赋值 的 随机 访问 算法 将 能 给 出 最 好 的 性 能 . 当 处 理 的 范围 不 能 
放 入 缓存 时 , Зп 次 赋值 的 双向 算法 或 者 3(n — ged(n, k)) 次 赋值 的 前 向 算法 比 
RK. 在 这 种 情况 下 , 究竟 是 双向 算法 还 是 前 向 算法 更 快 , 就 要 受到 其 他 因素 
的 影响 . 包括 双向 算法 里 的 循环 结构 更 规范 , 这 一 情况 有 可 能 抵消 掉 多 做 赋值 
的 影响 ; 还 有 一 些 处 理 器 体系 结构 的 细节 , 例如 其 缓存 配置 和 预 取 风 辑 . 还 应 
该 注意 , 这 些 算法 不 仅 执行 值 类 型 上 的 赋值 , 还 要 执行 迭代 器 操作 , 如 果 值 类 型 
的 规模 更 小 , 其 他 操作 的 相对 开销 就 增加 了 . 


项 目 10.1 请 设计 一 些 测试 集 , 针对 不 同 的 数组 规模 、 元 素 规模 、 轮 换 的 规模 
等 比较 各 种 算法 的 性 能 . 基于 通过 这 一 测试 集 得 到 的 结果 设计 一 个 组 合算 法 ， 
它 根 据 有 关 的 和 迭代 器 概念 、 范 围 的 规模 、 轮 换 的 规模 、 元 素 的 规模 、 缓 存 的 
规模 、 能 否 使 用 临时 缓冲 区 以 及 其 他 的 相关 考虑 , 选择 最 合适 的 轮换 算法 . 


WA 10.2 本 章 给 出 了 两 类 基于 位 置 的 重 整 算法 : 反 转 和 轮换 , 文献 里 还 有 这 
类 算法 的 另外 一 些 例子 . 请 为 基于 位 置 的 重 整 开发 一 套 分 类 体系 , 将 现 有 算法 
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38 10.1 不 同 轮换 算法 执行 赋值 的 次 数 




















算法 赋值 

indexed, random.access | n + gcd(n, k) 
bidirectional 3n ЕЙ 3(n — 2) 
forward 3(n — ged(n, k)) 
with_buffer n+(n—k) 
with_buffer_backward n+k 

partial 3k 








注意 : KBn=1-fitk=l—-m 


分 类 , 开发 出 缺失 的 算法 , 做 出 一 个 库 . 


10.6 总 结 


第 10 章 重 整 


置换 的 结构 使 人 可 以 设计 和 分 析 各 种 重 整 算法 . 即使 很 简单 的 问题 , 例如 反 转 
和 轮换 , 也 能 得 到 多 种 多 样 的 有 用 算法 . 合适 算法 的 选择 依赖 于 迭代 器 的 需求 
和 一 些 系 统 问题 . 原 地 算法 (in-place algorithm) 这 一 理论 概念 很 重要 , 存储 适应 


性 算法 提供 了 一 类 实际 的 替代 性 选择 . 
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划分 和 归并 


pg 在 展 
示 针 对 前 向 和 双向 迭代 器 的 几 个 划分 算法 后 , 我 们 将 实现 一 个 稳定 划分 算法 . 
而 后 引入 一 种 二 进 制 计 数 器 机 制 , 用 于 把 自 下 而 上 的 分 治 算法 变换 到 选 代 形 
A, 例如 可 以 对 稳定 划分 做 这 种 变换 . 随后 还 要 介绍 一 种 稳定 的 具有 存储 适应 
性 的 归并 算法 , 并 用 它 构造 一 个 高 效 的 、 具 有 存储 适应 性 的 、 可 用 于 前 向 选 
代 器 的 稳定 排序 算法 . 前 向 选 代 器 是 能 完成 重 整 的 最 弱 概 念 . 


11.1 划分 


第 6 章 介 绍 了 基于 谓词 来 划分 一 个 范围 的 概念 , 以 及 处 理 这 类 范围 的 基本 算法 
partition-point. 现在 考虑 一 些 把 任意 范围 转变 为 划分 了 的 范围 的 算法 . 

练习 11.1 请 实现 一 个 partitioned at point, 它 检测 一 个 给 定 有 界 范围 是 否 在 某 
个 特定 迭代 器 的 位 置 划分 . 


练习 11.2 请 实现 算法 potential partition point, 它 返 回 一 个 迭代 器 , 指向 如 果真 
的 做 划分 后 的 那个 划分 点 . 


引 理 11.1 如 果 m = potential partition point(f, 1, p), 那么 
count.if(f, m, p) = count-if_not(m, l, p) 


换 句 话 说, m 的 两 边 没 到 位 的 元 素 个 数 相 同 . 


这 一 引 理 给 出 了 划分 一 个 范围 所 需 的 最 少 赋值 次 数 , 即 2n 十 1, ep n Ж 
m 任意 一 侧 未 到 位 元 素 的 个 数 : In 次 赋值 用 于 未 到 位 元 素 , 另 一 个 赋值 用 于 临 
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时 变量 . 
引 理 11.2 存在 им! 个 能 划分 包含 u 个 假 值 和 v 个 真 值 的 范围 的 置换 . 


一 个 划分 重 整 是 稳定 的 (stable partition), 如 果 不 满足 谓词 的 元 素 的 相对 
位 置 都 能 保持 , 与 此 同时 满足 谓词 的 元 素 的 相对 位 置 也 都 能 保持 . 


引 理 11.3 稳定 划分 的 结果 唯一 . 


划分 重 整 是 半 稳 定 的 (semistable partition), 如 果 它 能 维持 所 有 不 满足 谓词 
的 元 素 的 相对 顺序 . 下 面 算 法 实现 了 半 稳 定 划分 :! 


template<typename I, typename P> 
requires(Mutable(I) && ForwardIterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
I partition.semistable(I f, I 1, P p) 


t 
// 前 条 件 : mutable bounded. range(f, 1) 
I i = findif(f, 1, р); 
if (i == 1) return i; 
I j = successor(i); 
while (true) { 
j = find if not(j, 1, р); 
if (j == 1) return i; 
swap-step(i, j); 
} 
} 


partition_semistable 的 正确 性 由 下 面 三 个 引 理 保证 . 
引 理 11.4 在 退出 检测 之 前 , none(f, i, p) Aall(i, j, p)- 
引 理 11.5 在 退出 检测 之 后 , p(source(i)) A —p(source(;)). 


引 理 11.6 在 调用 swap.step 之 后 , none(f, i, p) ^ all(i,j, р). 





1. Bentley [1984, 287-291 页 ] 将 这 一 算法 归功 于 Nico Lomuto. 
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半 稳 定 的 根据 是 下 面 事实 : 对 swap-step 的 调用 把 一 个 不 满足 谓词 的 元 素 
移 到 满足 谓词 的 元 素 范围 的 前 面 , 这 样 , 不 满足 谓词 的 元 素 的 顺序 不 变 . 

partition_semistable 只 是 在 swap.step 里 用 了 一 个 临时 对 象 . 

令 n=1 一 f 为 范围 里 元 素 的 个 数 , 并 令 w 为 跟 在 第 一 个 满足 谓词 的 元 素 
之 后 的 不 满足 谓词 的 元 素 的 个 数 . 这 样 该 谓词 将 应 用 n 次 , exchange-values 执 
行 w W, 而 迭代 器 做 增 量 的 次 数 为 n + w. 


练习 11.3 请 重 写 partition semistable, 把 对 find_if_not 的 调用 展开 并 删 去 对 ! 的 
多 余 检 测 . 


练习 11.4 请 将 算法 partition_semistable 里 的 swap.step(i,j) #29 copy-step(j, i). 给 
出 修改 后 的 这 个 算法 的 后 条 件 , 并 为 其 取 一 个 合适 的 名 字 , 并 比较 它 的 使 用 与 
partition_semistable 的 使 用 . 


Ип 为 被 划分 范围 里 元 素 的 个 数 . 
引 理 11.7 一 个 返回 划分 点 的 划分 重 整 需要 应 用 谓词 n 次 . 


引 理 11.8 如 果 一 个 针对 非 空 范围 的 划分 重 整 不 返回 划分 点 , 它 需 要 应 用 谓词 
n 一 1 次 .2 


练习 11.5 请 实现 一 种 对 非 空 范围 的 划分 重 整 , 它 只 应 用 谓词 n 一 1 X. 


考虑 一 个 范围 , 其 中 只 有 一 个 满足 谓词 的 元 素 , 它 之 后 是 n 个 不 满足 谓词 
的 元 素 . partition_semistable 将 执行 n 次 exchange_values 调用 , 而 实际 上 做 一 次 就 
ET. 如 果 组 合 使 用 对 满足 谓词 元 素 的 前 向 搜索 和 对 不 满足 谓词 元 素 的 后 向 
搜索 , 就 可 以 避免 不 必要 的 交换 . 下 面 这 个 算法 需要 双向 迭代 器 : 


template<typename I, typename P> 
requires(Mutable(I) && Bidirectionallterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
I partition bidirectional(I f, I 1, P p) 
t 
// B # fF: mutable_bounded_range(f, 1) 
while (true) { 





2. 这 一 引 理 和 紧 随 其 后 的 练习 来 自 Jon Brandt 给 我 们 的 建议 . 
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f = find if(f, 1, p); 
1 = find backward if not(f, 1, p); 
if (f -- 1) return f; 


reverse.swap step(1, f); 


与 partition. semistable — ff, partition. bidirectional 也 只 用 了 一 个 临时 对 象 . 


引 理 11.9 执行 exchange_values 的 次 数 v, 等 于 位 置 不 对 的 不 满足 谓词 的 元 素 的 
个 数 . 因此 赋值 的 总 次 数 是 3v. 

练习 11.6 请 为 前 向 迭代 器 实现 一 个 划分 重 整 算法 , 在 算出 了 划分 点 之 后 , 它 调 
用 exchange.values 的 次 数 与 partition_bidirectional 一 样 . 

有 可 能 用 另 一 个 不 同 的 重 整 完成 一 种 划分 , 其 中 只 做 一 遍 循环 , 而 且 只 用 
2v - 1 次 赋值 . 其 想法 是 保存 起 第 一 个 错位 元 素 , 留 下 一 个 “空位 ”, 而 后 反复 交 
替 地 在 划分 点 的 两 边 找到 的 错位 元 素 , 将 其 移 到 空位 并 从 而 做 出 一 个 新 的 空 
位 , 最 终 将 保存 的 元 素 移入 最 后 的 空位 . 
练习 11.7 请 采用 上 述 技术 实现 partition_single_cycle. 


练习 11.8 请 为 双向 迭代 器 实现 一 种 划分 重 整 , 它 找 出 适当 的 卫兵 (sentinel) 元 
Ж, 而 后 用 find_if unguarded 和 find_backward_if_not 的 不 带 条 件 检查 的 版 本 . 


练习 11.9 重 做 上 面 练习 , 把 一 遍 循环 的 技术 结合 进来 . 
双向 划分 算法 及 一 遍 循环 的 带 卫兵 划分 算法 , 都 来 自 C. A Б. Ноаге 3 


如 果 划 分 的 两 边 都 需要 稳定 性 , 而 且 有 与 原 范围 一 样 大 的 内 存 可 用 , 就 可 
以 采用 下 面 的 算法 : 


template<typename I, typename B, typename P> 
requires(Mutable(I) && ForwardIterator(I) && 
Mutable(B) && ForwardIterator(B) && 





3. JL Hoare [1962] 有 关 Quicksort 算法 的 论述 . 由 于 Quicksort 的 需要 , Hoare 的 划分 算法 交换 的 
是 大 于 或 等 于 给 定 元 素 的 元 素 与 小 于 或 等 于 给 定 元 素 的 元 素 . 相等 元 素 的 范围 将 从 中 间 分 开 . 
请 注意 , 关系 < 和 > 并 不 互补 . 
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ValueType(I) == ValueType(B) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
I partition stable with buffer(I f, I 1, B f b, P p) 


+ 
// 前 条 件 : mutable bounded. range(f, 1) 
// 前 条 件 : mutable counted range(f,, | — f) 
pair<I, B» x = partition copy(f, 1, f, f.b, p); 
copy(f_b, x.mi, x.m0); 
return x.m0; 
t 


如 果 没 有 足够 的 内 存 用 于 完整 大 小 的 缓冲 区 , 可 以 采用 一 种 分 治 算法 实现 
稳定 划分 . 如 果 范 围 里 只 有 一 个 元 素 , 它 自然 是 排 好 序 的 , 其 划分 点 可 以 通过 
应 用 一 次 谓词 得 到 : 


template<typename I, typename P> 





requires(Mutable(I) && ForwardIterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
pair<I, I> partition stable singleton(I f, P p) 


1 
// 前 条 件 : readable bounded. range(f, successor(f)) 
I 1 = successor(f); 
if (!p(source(f))) f = 1; 
return раіг&1, I>(f, 1); 
P 


返回 的 值 是 划分 点 和 范围 的 极限 . 换 句 话说 , 这 里 返回 的 是 满足 谓词 的 值 
的 范围 . 

两 个 邻接 的 划分 范围 可 以 组 合 为 一 个 更 大 的 划分 范围 , 方法 是 将 由 两 个 划 
分 点 确定 的 范围 围绕 着 该 范围 的 中 点 旋转 : 


template<typename I> 
requires(Mutable(I) && ForwardIterator(I)) 
pair<I, I> combine ranges(const pair<I, I>& x, 
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const pair<I, I>& y) 


1 

M 前 条 件 : mutable bounded. range(x.m0, y.m0) 

// 前 条 件 : x. m1 € [x. m0, y. m0] 

return pair<I, I>(rotate(x.m0, x.mi, у.ш0), y.m1); 
} 


引 理 11.10 combine.ranges 对 三 个 互 不 重 登 的 范围 的 应 用 是 可 结合 的 . 
引 理 11.11 如 果 对 某 个 谓词 A, 

(Vi € [x.m0, x.m1)) p(i) A 

(Vi € [x.m1, y.m0)) 7p(i) A 

(Vi € [y.m0, y.m1)) р(4) 


E 
» 
È 


2  combine_ranges(x, y) 


之 后 下 面条 件 成 立 : 


(Vi € [x.m0, z.m0)) ^p(i) 
(Vi € [z.m0, z.m1)) p(i) 


如 果 输 入 是 满足 谓词 的 值 的 范围 , 输出 也 是 . 这 样 , 一 个 非 单 个 元 素 的 范围 
可 以 通过 如 下 方法 完成 稳定 划分 : 将 它 从 中 间 分 割 为 两 半 , 递归 地 划分 这 两 个 
半 长 范围 , 而 后 将 划分 后 的 部 分 组 合 到 一 起 : 


template<typename I, typename P> 
requires(Mutable(I) && ForwardIterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
pair<I, I> partition stable n nonempty(I f, DistanceType(I) n, P p) 
{ 
// ВІ ЗЕ: mutable_counted_range(f,n) An > 0 
if (one(n)) return partition stable singleton(f, p); 


DistanceType(I) h = half nonnegative(n); 
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pair<I, I> х = partition stable n nonempty(f, h, p); 
pair<I, I> y = partition stable.n nonempty(x.mi, n - h, p); 


return combine .ranges(x, y); 


由 于 对 任何 多 于 一 个 元 素 的 范围 的 二 分 分 割 都 不 会 出 现 空 范围 , 因此 只 需 
要 在 最 上 层 处 理 空 范围 的 情况 : 


template<typename I, typename P> 
requires(Mutable(I) && ForwardIterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 
pair<I, I> partition stable n(I f, DistanceType(I) n, P p) 
1 
// 前 条 件 : mutable counted. range(f, n) 
if (zero(n)) return pair<I, I>(f, f); 


return partition stable n nonempty(f, n, p); 


在 递归 的 最 下 层 需要 执行 正好 п 次 谓词 应 用 . partition stable.n.nonempty 
递归 的 深度 是 flog. n]. 在 每 个 递归 层面 上 , 平均 需要 旋转 n/2 个 元 素 , 需要 做 
n/2 到 3n/2 次 赋值 (依赖 于 迭代 器 的 类 别 ). 对 随机 访问 迭代 器 , 总 赋值 次 数 是 
nloga n/2, 而 对 前 向 和 双向 迭代 器 总 赋值 次 数 是 3n logs n/2. 


练习 11.10 请 利用 前 一 章 的 技术 , 做 出 partition.stable.n 的 一 个 具有 存储 适应 
性 的 版 本 . 


11.2 平衡 的 归 约 


虽然 partition_stablen 的 性 能 依赖 于 所 处 理 的 范围 里 的 中 点 分 割 , 但 其 正确 性 
并 不 依赖 于 这 一 点 . 因为 combine_ranges 是 一 个 部 分 可 结合 运算 , 因此 其 子 段 
分 割 可 以 在 任何 位 置 进 行 . 利用 这 一 事实 可 以 做 出 一 个 性 能 类 似 的 迭代 算法 . 
在 一 些 情况 下 , 例如 事先 不 知道 范围 的 规模 , 或 者 希望 消除 过 程 调用 的 开销 , 这 
样 的 算法 非常 有 用 . 这 里 的 基本 想法 是 进行 归 约 , 将 partition_stable singleton 应 
用 于 每 个 单个 元 素 的 范围 , 而 后 用 combine_ranges 组 合 得 到 的 结果 : 
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reduce_nonempty ( 
fs s 
combine_ranges<I>, 


partitiontrivial<I, P>(p)); ` 
partition. trivial 是 一 个 函数 对 象 , 把 谓词 的 参数 绑 定 到 partition. stable. singleton: 


template<typename I, typename P> 
requires(ForwardIterator(I) && 
UnaryPredicate(P) && ValueType(I) == Domain(P)) 


struct partition trivial 


1 
P p; 
partition trivial(const P & p) : р(р) { } 
pair<I, I> operator()(I i) 
{ 
return partition_stable_singleton<I, P>(i, p); 
} 
н 


如 果 在 这 里 调用 reduce-nonempty, 就 会 导致 平方 复杂 性 . 现在 要 利用 运算 
的 部 分 可 结合 性 , 建立 起 一 棵 平衡 的 归 约 树 . 下 面 将 使 用 二 进 制 计 数 器 技术 ， 
自 下 而 上 地 构造 这 棵 归 约 树 .4 对 硬件 二 进 制 计数 器 的 增 量 操作 给 一 个 n- 位 的 
二 进 制 整数 加 1. 在 位 置 i 的 1 具有 2:' 的 权重 (weight); 从 这 个 位 置 的 进位 具 
有 权 值 277 并 传 到 下 一 高 位 . 这 里 要 用 计数 器 中 位 置 i 的“ 位” 表示 或 者 是 空 ， 
或 者 是 从 原 范围 归 约 2' 个 元 素 的 结果 . 当 进位 传 到 下 一 高 位 时 , 它 或 者 被 存 下， 
或 者 与 另 一 具有 同样 权 的 值 组 合 . 从 最 高 位 的 进位 被 下 面 过 程 返回 , 该 过 程 以 
单位 元 作为 一 个 显 式 参数 , 与 reduce_nonzeroes 一 样 : 


template<typename I, typename Op> 
requires(Mutable(I) && ForwardIterator(I) && 
BinaryOperation(Op) && ValueType(I) == Domain(Op)) 





4. Knuth (1998, 5.2.4 节 (归并 排序 ), 练习 17, 167 页 ] 里 把 这 一 技术 归功 于 John McCarthy. 
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Domain(Op) add_to_counter(I f, I 1, Op op, Domain(Op) x, 
const Domain(Op)& z) 


t 
if (x == z) return z; 
while (f != 1) { 
if (source(f) == z) { 
sink(f) = x; 
return z; 
} 
x = op(source(f), x); 
sink(f) = z; 
f = successor(f); 
} 
return x; 
} 


计数 器 使 用 的 存储 由 下 面 类 型 提供 , 该 类 型 还 处 理 来 自 add to counter 的 
йн, 方式 就 是 扩展 计数 器 : 


template<typename Op> 
requires (BinaryOperation(Op) ) 
struct counter machine 
t 
typedef Domain(Op) T; 
Op op; 
T =; 
Т £[64]; 
pointer(T) 1; 
counter_machine(Op op, const Domain(Op)& z) : 
op(op), z(z), 1($) { } 
void operator()(const T& x) 


{ 
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// 前 条 件 : 不 能 被 调用 多 于 295 一 1 X 
T tmp = add to counter(f, 1, op, x, z); 
if (tmp (= z) { 

sink(1) = tmp; 


1 = successor(1); 


>; 


这 里 用 了 一 个 C++ 的 数组 ; 也 可 以 考虑 其 他 实现 方式 .5 
在 对 范围 里 的 每 个 元 素 调 用 add. to_counter Z Jš, 用 最 左 归 约 的 方式 组 合 
起 计数 器 里 的 所 有 非 空位 置 , 就 能 得 到 最 后 结果 : 


template<typename I, typename Op, typename F> 
requires(Iterator(I) && BinaryOperation(Op) && 
UnaryFunction(F) && I == Domain(F) && 
Codomain(F) == Domain(0p)) 
Domain(Op) reduce.balanced(I f, I 1, Op op, F fun, 
const Domain(Op)& z) 


1 
// BI # fF: bounded range(f, 1) A 1— f < 294 
// 前 条 件 : partially associative(op) 
// 前 条 件 : (Vx є [f 0) fun(x) 有 定义 
counter machine<0p> c(op, z); 
while (f != 1) ( 

c(fun(£)); 

f = successor(f); 
transpose_operation<Op> t_op(op) ; 
return reduce.nonzeroes(c.f, c.l, t op, 2); 

Y 





5.3 64 个 元 素 的 数组 可 以 处 理 64- 位 体系 结构 上 的 任何 应 用 程序 . 
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计数 器 里 更 高 位 的 那些 值 对 应 于 原 范围 的 较 早 元 素 , 而 且 这 里 的 运算 不 是 
可 交换 的 . 因此 必须 采用 该 运算 的 一 个 反 转 的 版 本 , 该 版 本 可 以 通过 下 面 函数 
对 象 得 到 : 


template<typename Op> 
requires(BinaryOperation(0p)) 

struct transpose_operation 

1 
Op op; 
transpose_operation(Op op) : op(op) í } 
typedef Domain(Op) T; 
T operator() (const T& x, const Tk y) 
1 


return op(y, x); 
}; 


现在 就 可 以 用 迭代 的 方式 实现 稳定 划分 了 , 下 面 是 这 个 过 程 : 


template<typename I, typename P> 
requires(ForwardIterator(I) && UnaryPredicate(P) && 
ValueType(I) == Domain(P)) 
I partition stable iterative(I f, I 1, P p) 
1 
// Wil & fF: bounded range(f, 1) A1— f < 264 
return reduce.balanced( 
1, 1, 
combine ranges<I>, 
Partition-trivial<I, P>(p), 
pair<I, I>(f, f) 
).m0; 
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pair, (f, f) 是 表示 单位 元 的 好 办 法 , 因为 它 绝 不 会 被 partition trivial 或 上 面 
的 组 合 运算 返回 . 

这 个 迭代 算法 构造 出 的 归 约 树 与 前 面 的 递归 过 程 不 同 . 当 问 题 的 大 小 正好 
等 于 2* 时 , 递归 的 和 迁 代 的 算法 版 本 将 执行 同样 的 组 合 序列 ; 否则 , 迭代 的 版 
本 可 能 多 做 至 多 线性 数量 的 额外 工作 . 例如 , 在 某 些 情况 下 , 算法 的 复杂 性 会 从 
nlogzn AE nlogyn+ 5. 


练习 11.11 利用 reduce balanced 实现 第 8 3 sort linked nonempty.n 的 和 迭代 版 本 . 
练习 11.12 利用 reduce balanced 实现 第 10 章 reverse n adaptive 的 迭代 版 本 . 


练习 11.13 利用 reduce balanced 实现 partition.stable.n 的 迭代 的 和 具有 存储 适 
应 性 的 版 本 . 


11.3 归并 


第 9 章 给 出 了 一 些 拷贝 式 的 归并 算法 , 它们 将 两 个 上 升 范围 归并 到 第 三 个 上 升 
范围 . 对 排序 而 言 , 将 两 个 毗邻 的 上 升 范围 归并 为 一 个 上 升 范围 的 重 整 是 很 有 
用 的 操作 . 如 果 有 一 块 与 第 一 个 范围 同样 大 的 缓冲 区 , 就 可 以 用 下 面 过 程 :8 


template<typename I, typename B, typename R> 
requires(Mutable(I) && ForwardIterator(I) && 
` Mutable(B) && ForwardIterator(B) && 
ValueType(I) == ValueType(B) && 
Relation(R) && ValueType(I) == Domain(R)) 
I merge n-with buffer(I #0, DistanceType(I) nO, 
I fi, DistanceType(I) ni, Bf b, R r) 


// WHE: mergeable(fo, no, fi, ni, r) 

// BI & fF: mutable counted range(f,, no) 

copy.n(fO, nO, f.b); 

return merge copy n(f.b, n0, fi, ni, #0, r).m2; 





6.5523 9.5 的 解 可 以 解释 为 什么 需要 提取 成 员 m2. 
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} 
其 中 mergeable 的 定义 如 下 : 


property(I : ForwardIterator, N : Integer, R : Relation) 
requires( Mutable(I) ^ ValueType(I) = Domain(R)) 
mergeable:1 x Nx Ix N x R 
(fo, по, fnit) > fo+no=fiA 
mutable_counted_range(fo, no + n1) A 
weak.ordering(r) A 
increasing.counted range(fo, no, r) A 


increasing. counted range(fi, ni, r) 
3138 11.12 merge. n. with. buffer 的 后 条 件 是 
increasing counted. range(fo, no + n1, r) 


一 个 归并 是 稳定 的 , 如 果 其 输出 范围 里 维持 了 各 输入 范围 里 的 所 有 相等 元 
素 的 相对 顺序 , 也 维持 了 第 一 和 第 二 个 范围 里 相等 的 元 素 的 相对 顺序 . 


引 理 11.13 merge_n_with_buffer 是 稳定 的 . 


注意 , merge-linked-nonempty, merge-copy 和 merge_copy_backward 也 都 稳定 . 
可 以 用 一 半 规 模 的 缓冲 区 完成 对 一 个 范围 的 排序 :7 


template<typename I, typename B, typename R> 
requires(Mutable(I) && ForwardIterator(I) && 
Mutable(B) && ForwardIterator(B) ёё 
ValueType(I) == ValueType(B) && 
Relation(R) && ValueType(I) == Domain(R)) 
I sort n with buffer(I f, DistanceType(I) n, Bf b, R r) 
t 
// BI & fF: mutable.counted range(f, п) A weak_ordering(r) 
// BI # fF: mutable_counted_range(f,, [n/2]) 





7.John W. Mauchly 在 其 报告 “Sorting and collating” [Mauchly 1946]A 里 第 一 次 描述 了 一 个 类 
似 算法 . 
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DistanceType(I) h = half_nonnegative(n) ; 
if (zero(h)) return f + n; 
I m sort nwith buffer(f, h, fb, r); 
sort-n with buffer(m, n - h, f b, r); 
return merge. n vith buffer(f, h, m, n - h, f.b, r); 
了 


引 理 11.14 sort_n_with_buffer 的 后 条 件 是 


increasing-counted-range(f, n, r) 


一 个 排序 算法 是 稳定 的 , 如 果 它 能 维持 等 值 元 素 的 相对 顺序 . 
引 理 11.15 sort_n_with_buffer 是 稳定 的 . 


这 一 算法 递归 [logn] J. 每 层 执 行 至 多 3n/2 个 赋值 , 总 数 受 园 于 
$nflogy n]. 在 自 下 而 上 数 的 第 i 层 , 最 坏 情况 下 的 比较 次 数 是 — д, 这 就 
给 出 了 比较 次 数 的 上 界 : 

floga n] 
n[logo n] 一 > Ж z n[log;n] — n 
i=l 

如 果 有 足够 大 的 缓冲 区 可 用 , sort_n_with_buffer 是 一 个 高 效 算 法 . 如 果 可 用 
的 存储 较 少 , 可 以 用 一 个 具有 存储 适应 性 的 算法 . 把 第 一 个 子 范围 从 中 间 割 
Ж, 再 用 这 一 中 间 元 素 作为 下 界 分 割 第 二 个 子 范围 , 结果 将 得 到 四 个 子 范围 
Tos Tis та 和 3, 其 中 心里 的 值 严格 小 于 Ti 里 的 值 . 旋转 r 和 ra 就 得 到 了 两 个 
归并 子 问 题 : (ro 和 ra 归并 , ri 和 тз 归并 ): 


template<typename I, typename R> 

requires(Mutable(I) && ForwardIterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 

void merge.n step.O(I #0, DistanceType(I) n0, 
I fi, DistanceType(I) ni, R r, 
I& f0.0, DistanceType(I)& n0 0, 
1& f0.1, DistanceType(I)& n0 1, 
I& f1.0, DistanceType(I)& ni. 0, 
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Ik f11, DistanceType(I)& ni.1) 


t 
// 前 条 件 : mergeable( fo, по, f1, n1, r) 
£0.0 = £0; 
n0.0 = half nonnegative(n0); 
f0.1 = f0.0 + n0.0; 
fl-1 = lower bound n(fi, ni, source(f0.1), г); 
f1.0 = rotate(fO 1, fl, f1.1); 
n0.1 = #10 - f0.1; 
f1.0 = successor(f1.0); 
п1.0 = predecessor(nO - n0.0); 
ni.i = nl - n0.1; 

} 


引 理 11.16 这 里 的 轮换 并 不 改变 等 值 元 素 的 相对 位 置 . 


在 一 个 范围 里 , 迭代 器 让 是 一 个 枢 轴 (pivot), 如 果 它 的 值 不 小 于 它 前 面 的 
任何 值 , 而 且 不 大 于 它 之 后 的 任何 值 . 


引 理 11.17 在 merge.n.step.0 之 后 f1.0 是 一 个 枢 轴 . 
也 可 以 用 upper-bound 从 右边 开始 做 类 似 分 割 : 


template<typename I, typename R> 
requires(Mutable(I) && ForwardIterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
void merge.n.step.1(I #0, DistanceType(I) n0, 
I fi, DistanceType(I) ni, Rr, 
Ik f0.0, DistanceType(I)& n0_0, 
тё f0.1, DistanceType(I)& n01, 
Ik 11-0, DistanceType(I)& п1.0, 
I& 11-1, DistanceType(I)& ni.1) 


// WATE: mergeable(fo, no, f1, mi, r) 
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f0.0 = £0; 

n0.1 = half nonnegative(n1) ; 

#11 = f1 + n0.1; 

f0.1 = upper bound.n(fO, nO, source(fi.1), r); 
£11 = successor(fi 1); 

#1-0 = rotate(fO 1, f1, f1.1); 

n0.0 = f0.1 - #00; 

ni.O = nO - n0.0; 


ni.i = predecessor(ni - n0.1); 


这 样 就 得 到 了 下 面 的 算法 (来 自 Dudziński and Dydek [1981]): 


template<typename I, typename B, typename R> 
requires(Mutable(I) && ForwardIterator(I) && 
Mutable(B) && ForwardIterator(B) && 
ValueType(I) == ValueType(B) && 
Relation(R) && ValueType(I) == Domain(R)) 
I merge_nadaptive(I #0, DistanceType(I) n0, 
I fi, DistanceType(I) ni, 
B f.b, DistanceType(B) n.b, R r) 


// Bi & fF: mergeable(fo, no, fi, n1, т) 
// 前 条 件 : mutable counted. range(f,, ть) 
typedef DistanceType(I) N; 
if (zero(n0) || zero(n1)) return fO + nO + ni; 
if (n0 <= N(nb)) 

return merge.n with buffer(fO, nO, fi, ni, f.b, r); 
I £0.03 J. f0-l; I f1.0; I f1.1; 
N n0.0; N n0.1; N n1.0; N n1.1; 
if (nO < n1) merge n step.O( 

#0, nO, fi, n1, т, 
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f0.0, n00, f0_1, nO.1, 
£120, n1:0, f1-1, 11-1); 
else merge.n step.1( 
40, nO, fi, ni, г, 
f0.0, n00, #01, n0.1, 
£10, n1.0, f1.1, 01.1); 
merge.n adaptive(f0 0, n0.0, #01, n0.1, 
fb, nb, г); 
return merge.n adaptive(fi 0, n1.0, #11, nit, 
f.b, nb, г); 


8| 11.18 merge.n adaptive 终止 时 将 得 到 一 个 递增 范围 . 
引 理 11.19 merge_n_adaptive 是 稳定 的 . 
引 理 11.20 至 多 有 |log;(min(n0,n1))] +1 3B IH. 

利用 merge_n_adaptive 可 以 实现 下 面 排序 算法 : 


template<typename I, typename B, typename R> 
requires(Mutable(I) && ForwardIterator(I) && 
Mutable(B) && ForwardIterator(B) && 
ValueType(I) == ValueType(B) && 
Relation(R) && ValueType(I) == Domain(R)) 
I sort_n_adaptive(I f, DistanceType(I) n, 
B f.b, DistanceType(B) n.b, R r) 


// 前 条 件 : mutable.counted.range(f, n) ^ weak.ordering(r) 
// Bi & fF: mutable counted. range(f,, ns) 
DistanceType(I) h = half nonnegative(n); 

if (zero(h)) return f * n; 

I m = sort nadaptive(f, h, fb, nb, r); 


Sort nadaptive(m, n - h, f b, n.b, r); 
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return merge.n adaptive(f, h, m, n - h, f.b, nb, r); 
} 


练习 11.14 请 确定 一 个 公式 , 它 将 赋值 次 数 和 比较 次 数 描述 为 输入 和 缓冲 区 
的 规模 的 函数 . 文献 Dudziński and Dydek [1981] 包含 了 对 无 缓冲 区 时 的 复杂 性 
的 细致 分 析 . 


我 们 可 以 总 结 出 下 面 算 法 : 





template<typename I, typename R> 
requires(Mutable(I) && ForwardIterator(I) && 
Relation(R) && ValueType(I) == Domain(R)) 
I sort_n(I f, DistanceType(I) n, R r) 


1 
// WI & fF: mutable_counted_range(f, n) ^ weak. ordering(r) 
temporary buffer«ValueType(I)» b(half nonnegative(n)); 
return sort_n_adaptive(f, n, begin(b), size(b), г); 

} 


它 只 有 最 低 的 迭代 器 要 求 , 是 稳定 的 , 即使 temporary-buffer 只 能 分 配 到 很 
小 百分比 的 所 请 求 存储 , 它 也 是 高 效 的 . 


项 目 11.1 请 基于 各 种 抽象 组 件 开发 一 个 排序 算法 库 , 设计 一 些 标准 测试 , 根据 
不 同 的 数组 大 小 、 元 素 大 小 和 缓冲 区 大 小 , 分 析 这 些 算法 的 性 能 . 给 这 个 库 写 
出 文档 , 包括 各 算法 适合 在 什么 环境 中 使 用 的 建议 . 


11.4 总 结 


复杂 的 算法 可 以 分 解 为 一 些 较 简单 的 抽象 组 件 , 它们 带 有 细致 定义 的 接口 . 这 
样 发 现 的 组 件 后 来 可 以 用 于 实现 其 他 算法 . 这 种 从 复杂 到 简单 , 然后 再 转 回去 
的 迭代 过 程 , 是 发 现 有 效 组 件 的 系统 化 分 类 体系 的 核心 工作 . 
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复合 对 象 


AE 

E 6 到 第 11 章 展 示 了 一 批 算法 , 它们 都 通过 迭代 器 或 坐标 结构 作用 于 对 
象 的 汇集 (数据 结构 ), 其 行为 与 这 些 对 象 汇集 的 构造 、 析 构 和 结构 变动 无 关 ， 
因为 算法 中 并 没有 把 对 象 汇集 本 身 看 作对 象 . 本 章 将 给 出 一 些 复 合 对 象 的 例 
+, 从 二 元 组 和 常量 规模 的 数组 开始 , 直至 动态 序列 的 一 系列 实现 . 这 里 要 描 
述 一 种 复合 对 象 包含 其 他 对 象 作为 其 组 成 部 分 的 通用 模式 .最 后 要 展示 一 种 
机 制 , 它 使 我 们 可 以 有 效 地 描述 谍 套 的 复合 对 象 上 的 重 整 算法 . 
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为 了 理解 如 何 把 规范 性 延 拓 到 复合 对 象 , 这 里 的 讨论 将 从 一 些 简单 情况 开始 . 
第 1 章 介绍 了 类 型 构造 子 pair, 给 它 一 对 类 型 To A T, 它 返 回 一 个 结构 类 型 
pairs, n. 现在 用 一 个 结构 模板 和 若干 全 局 过 程 实现 pair: 


template<typename TO, typename T1» 
requires(Regular(TO) && Regular(T1)) 
Struct pair 
1 
TO m0; 
Ti mi; 
pairO { } // 默认 构造 函数 
pair(const TO& mO, const Tig mi) : mO(mO), mi(m1) { Y 
J; 
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C++ 保证 默认 构造 函数 (default constructor) 执行 两 个 成 员 的 构造 工作 ， 
保证 它们 能 达到 部 分 完成 的 状态 , 而 后 可 以 赋值 和 销毁 . C++ 自动 生成 拷贝 构 
3& Ж Ж (сору constructor) 和 赋值 ， 它们 都 逐个 拷贝 或 赋值 对 象 的 各 个 成 员 ; 还 
自动 生成 一 个 析 构 函数 (destructor), 它 将 调用 各 成 员 的 析 构 函数 . 相等 和 序 判 
断 则 需要 手工 给 出 : 


template<typename TO, typename T1> 
requires(Regular(TO) && Regular(T1)) 
bool operator--(const pair<TO, Ti>& x, const pair«TO, T1>& y) 
{ 
return х.ш0 == y.mO && x.ml == y.ml; 
} 


template<typename TO, typename Т1> 
requires(TotallyOrdered(TO) && TotallyOrdered(T1)) 
bool operator<(const pair«TO, Т1>& x, const pair«TO, Ti>& y) 
1 
return x.mO < y.mO || (!(y.mO < x.mO) && x.mi < y.m1); 
} 


练习 12.1 请 为 pairro,n 实现 一 种 默认 的 序 关系 , less, 其 中 利用 TD AM TI 的 默认 
FE, 用 于 两 个 成 员 类 型 都 不 是 全 序 集 的 情况 . 


练习 12.2 请 实现 triple, nm: 


pair 是 一 种 异类 型 (heterogeneous type) 的 类 型 构造 子 , 而 аггау К 是 一 种 同 
类 型 的 (homogeneous type) 构造 子 , 给 定 整数 k 和 类 型 下 它 返 回 常量 规模 的 序 
列 类 型 array-k, r: 


template<int k, typename T> 
requires(0 < k && k <= MaximumValue(int) / sizeof(T) && 
Regular(T)) 
struct array. k 
1 
T alk]; 
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T& operator[] (int i) 
{ 
// WHE: 0 <i<k 


return a[i]; 


un 


对 kx 的 要 求 基 于 类 型 的 属性 描述 . MaximumValue(N) 返回 整数 类 型 N 能 表 
示 的 最 大 值 , sizeof 是 内 在 的 类 型 属性 , 返回 类 型 的 规模 . C++ 为 аггау к 生成 
语义 正确 的 默认 构造 函数 、 找 贝 构造 函数 、 赋 值 和 析 构 函数 . 用 于 读 写 x 中 的 
成 员 函 数 需 要 自己 实现 . 

IteratorType(array_k, ,) 定义 为 指向 T 的 指针 . 这 里 提供 两 个 过 程 , 分 别 返 回 
数组 里 的 第 一 个 元 素 和 元 素 的 极限 :? 


template<int k, typename T> 


requires(Regular(T)) 
pointer(T) begin(array k«k, T>& x) 
t 

return addressof (x.a[0]); 
} 


template<int k, typename Т> 


requires (Regular (T)) 
pointer(T) end(array.k«k, T>& x) 
{ 

return addressof (x.a[k]); 

k 





array-k, + 类 型 的 对 象 x 可 以 用 下 面 代码 初始 化 为 计数 [f k) 的 拷贝 


copy-n(f, К, begin(x)); 





1. RAR begin 和 end — FÉ, 重 载 的 常数 也 需要 完整 的 实现 . 
2. 完 整 的 实现 还 需 提供 常量 迭代 器 类 型 ,将 其 定义 为 指向 的 常量 指针 , 还 需 定义 在 array k Ж 
HEER begin 和 end, 它们 的 返回 类 型 是 常量 迭代 器 . 
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我 们 还 不 知道 如 何 实现 一 种 合适 的 能 完成 初始 化 的 构造 函数 , 使 之 可 以 不 
自动 构造 数组 里 的 每 个 元 素 . 另外 , 前 面 定义 的 copy-n 可 以 接受 各 种 迭代 器 并 
返回 极限 迭代 器 . 但 是 我 们 没 办 法 让 拷贝 构造 函数 返回 极限 迭代 器 . 

数组 上 的 相等 和 序 可 以 用 第 7 章 的 字典 序 的 扩展 : 


template<int k, typename T> 
requires (Regular (T)) 
bool operator==(const array-k<k, T>& x, const array-k<k, T>& y) 
{ 
return lexicographical_equal(begin(x), end(x), 
begin(y), end(y)); 
} 


template<int k, typename T> 
requires (Regular(T)) 
bool operator<(const array_k<k, T>& x, const array k«k, T>& у) 
4 
return lexicographical less(begin(x), end(x), 
begin(y), end(y)); 
J 


练习 12.3 请 为 array К, , 实现 = 和 <, 使 之 能 为 很 小 的 k 生成 inline 展开 的 代 
码 . 


练习 12.4 请 为 array-k + 实现 默认 序 less. 
下 面 过 程 返回 数组 元 素 的 个 数 : 


template<int k, typename T> 





requires (Regular (T)) 
int size(const array.k«k, T>& x) 
í 

return k; 
} 


另 一 过 程 判断 其 规模 是 否 为 0: 
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template<int К, typename Т> 


requires(Regular(T)) 
bool empty(const array k<k, T>& x) 
1 

return false; 
У 


还 需 不 厌 其 烦 地 去 为 array k 定义 size ЖП empty, 使 之 可 以 建 模 Sequence. 这 
些 事 待 会 再 做 . 


练习 12.5 请 扩充 array-k, 使 之 能 接受 k=0 的 情况 . 
array-k 建 模 概念 Linearizable (可 线性 化 ): 


Linearizable(W) 全 
Regular(W) 
A IteratorType : Linearizable — Iterator 
^ ValueType : Linearizable — Regular 
W + ValueType(IteratorType(W)) 
A SizeType : Linearizable — Integer 
W > DistanceType(IteratorType(W)) 
A begin : W 一 IteratorType(W) 
A end : W — IteratorType(W) 
A size : W — SizeType(W) 
x i> end(x) — begin(x) 
A empty : W — bool 
x + begin(x) = end(x) 
A [] : W x SizeType(W) 一 ValueType(W)& 
(м, i) к> deref(begin(w) + i) 


empty 判断 只 需 常量 时 间 , 即使 对 那些 size 需要 线性 时 间 的 情况 . whi) 的 前 
条 件 是 0 < < size(w); 其 复杂 性 由 精 化 Linearizable 概念 规范 的 迭代 器 类 型 确 
Ж: 对 前 向 和 双向 迭代 器 是 线性 时 间 , 对 指标 和 随机 访问 迭代 器 是 常量 时 间 . 
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可 线性 化 的 类 型 用 一 对 标准 函数 begin 和 end 描述 一 个 迭代 器 范围 , 但 与 
array-k 的 情况 不 同 , 拷贝 一 个 线性 化 的 实体 不 必 拷 贝 其 基础 元 素 . 正如 在 下 面 
将 要 看 到 的 , 这 种 实体 不 是 容器 (container), 不 是 拥有 一 批 元 素 的 序列 . 举例 说 ， 
下 面 类 型 建 模 Linearizable, 但 它 不 是 容器 , 而 只 是 指定 了 位 于 某 个 数据 结构 
的 迁 代 器 的 一 个 有 界 范围 : 





ш 


template<typename I> 
requires(Readable(I) && Iterator(I)) 
struct bounded_range { 
If; 
I1; 
bounded.range() { ) 
bounded.range(const I& f, const Ik 1) : f(f), 1(1) ( ) 
const ValueType(I)& operator[](int i) 
& 
// 前 条 件 : 0<i<1 一 f 


return source(f + i); 


}; 


C++ 自动 为 其 生成 拷贝 构造 函数 、 赋 值 和 析 构 函数 , 它们 的 语义 与 
pair; 的 情况 一 样 . ШШ Ж T Ж bounded_range,, 那么 IteratorType(T) 就 定义 为 1, 而 
SizeType(T) 定义 为 DistanceType(1). 

与 迭代 器 有 关 的 过 程 可 以 直截了当 地 定义 : 
template<typename I> 

requires(Readable(I) && Iterator(I)) 


I begin(const bounded_range<I>& x) { return x.f; } 


template<typename I> 
requires(Readable(I) && Iterator(I)) 


I end(const bounded_range<I>& x) { return x.l; } 


template<typename I> 
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requires(Readable(I) && Iterator(I)) 
DistanceType(I) size(const bounded_range<I>& x) 
£ 

return end(x) - begin(x); 


template<typename I> 
requires(Readable(I) && Iterator(I)) 

bool empty(const bounded range<I>& x) 

1 


return begin(x) == end(x); 


与 array-k 不 同 , bounded. range 的 相等 判断 不 采用 字典 序 相等 , 而 是 把 对 象 
作为 一 对 和 迭代 器 来 处 理 , 直接 比较 对 应 的 值 : 


template<typename I> 
requires(Readable(I) && Iterator(I)) 


bool operator==(const bounded_range<I>& x, 

const bounded_range<I>& y) 

{ š 
return begin(x) == begin(y) && end(x) == end(y); 


这 样 定义 的 相等 与 C++ 生成 的 拷贝 构造 函数 一 致 , C++ 也 将 它 处 理 为 一 
对 和 迭代 器 . 考虑 一 个 建 模 Linearizable 的 类 型 w. 如 果 w 是 一 个 具有 线性 坐标 
结构 的 容器 , lexicographical equal 是 它 正确 的 相等 判断 , 就 像 前 面 针 对 array_k 的 
定义 那样 . 如 果 w 是 一 个 同类 容器 , 其 坐标 结构 不 是 线性 的 (例如 一 棵 树 或 一 
个 矩阵 ), 那么 lexicographical.equal 或 者 范围 相等 (如 前 面 为 bounded_range 定义 
的 判断 ) 都 不 是 正确 的 相等 判断 , 虽然 lexicographical. equal 可 能 仍然 是 有 用 的 算 
法 . 如 果 W 不 是 容器 , 而 只 不 过 是 另 一 数据 结构 所 拥有 的 一 个 范围 的 描述 , 范 
围 相 等 就 是 正确 的 相等 判断 了 . 
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对 于 bounded.range, 的 默认 全 序 是 在 一 对 迭代 器 上 定义 的 字典 序 , 采用 1 
上 的 默认 全 序 : 


template<typename I> 
requires(Readable(I) && Iterator(I)) 


struct less< bounded range<I> > 


T 
bool operator()(const bounded_range<I>& x, 
const bounded range<I>t& y) 
t 
less<I> less_I; 
return less_I(begin(x), begin(y)) || 
(!less.I(begin(y), begin(x)) && 
less I(end(x), end(y))); 
} 
LH 


即使 一 个 迭代 器 类 型 没有 自然 的 全 序 , 也 要 为 它 提 供 一 个 全 序 : 例如 , 638 
代 器 的 二 进 制 表示 看 作 一 个 无 符号 整数 . 

pair 和 array к 都 是 广义 的 复合 对 象 (composite object) 的 具体 实例 ,说 一 
个 对 象 是 复合 对 象 , 如 果 它 是 由 其 他 对 象 构造 起 来 的 , 那些 对 象 称 为 它 的 组 
分 (part). 整体 -组 分 关系 满足 四 条 性 质 : 联系 性 、 无 环 性 、 不 相交 性 和 拥有 
Ж Ж. 联系 性 (connectedness) 意味 着 复合 对 象 有 一 种 包容 性 的 坐标 结构 , 从 这 
种 对 象 的 起 始 地 址 (starting address) 出 发 , 可 以 到 达 该 对 象 的 每 个 组 分 . 无 环 
性 (noncircularity) 要 求 一 个 对 象 不 能 是 其 自身 的 一 个 子 组 分 . 对 象 的 子 组 分 
(subpart) 是 指 其 组 分 , 或 者 其 组 分 的 子 组 分 . (无 环 性 蕴涵 着 一 个 对 象 不 能 是 
自己 的 组 分 .) 不 相交 性 (disjointness) 意味 着 如 果 两 个 对 象 有 公共 的 子 组 分 , Ж 
么 一 定 有 一 个 对 象 是 另 一 个 的 组 分 . 拥有 关系 (ownership) 意味 着 拷贝 一 个 对 
象 就 要 拷贝 它 的 组 分 , 而 析 构 一 个 对 象 就 要 析 构 它 的 组 分 . 说 一 个 对 象 是 动态 
的 (dynamic), 如 果 在 它 的 生存 期 间 其 组 分 集合 可 能 变化 . 

我 们 将 称 复合 对 象 的 类 型 为 复合 对 象 类 型 , 称 由 复合 对 象 类 型 建 模 的 概念 
为 复合 对 象 概念 . 不 可 能 针对 复合 对 象 定义 任何 算法 , 因为 复合 对 象 是 一 个 概 
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念 模式 而 不 是 一 个 概念 . 
array_k 是 概念 Sequence (序列 ) 的 一 个 模型 , 序列 是 一 个 复合 对 象 概念 ， 它 
精 化 了 Linearizable, 它 的 组 分 就 是 它 的 元 素 范围 : 


Sequence(S) 全 
Linearizable(S) 
^ (Ws € S) (Vi € [begin(s), end(s))) deref(i) Ж s 的 一 部 分 
A =:S х S — bool 
(s, s^) > lexicographical equal( 
begin(s), end(s), begin(s’), end(s’)) 
A <:S x S — bool 
(s, s^) — lexicographical_less( 
begin(s), end(s), begin(s’), end(s’)) 


du s ЖП s' 相等 但 它们 不 是 同一 个 序列 , 那 就 一 定 有 begin(s) Z begin(s"), 
但 source(begin(s)) = source(begin(s’)). 这 是 投影 规范 化 (projection regularity) 的 
一 个 实例 . 请 注意 , 对 于 并 非 Sequence 的 Linearizable, begin 和 end 也 可 以 是 规 
范 的 . 例如 , 对 于 bounded_range, 它们 都 是 规范 的 . 


练习 12.6 请 定义 性 质 projection_regular_function. 
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атау К, т 是 一 个 常量 规模 的 序列 (constant-size sequence). 参数 k 在 编译 时 确 
E, 并 将 应 用 于 这 一 类 型 的 所 有 对 象 . 我 们 没有 为 常量 规模 的 序列 定义 相应 概 
Ж, 因为 没有 看 到 其 他 有 用 的 模型 . 类 似 的 , 对 于 在 构造 时 确定 规模 的 序列 , m 
定 规模 的 序列 (fixed-size sequence), 我 们 也 不 专门 定义 这 种 概念 . 因为 所 有 建 模 
固定 规模 的 序列 的 数据 结构 也 都 建 模 动态 规模 的 序列 (dynamic-size sequence). 
这 种 动态 序列 的 规模 随 元 素 插入 删除 而 变化 . (当然 , 确实 存在 着 一 些 固定 规模 
HAAR, w n x n 的 方 阵 .) 

无 论 建 模 动态 序列 的 具体 数据 结构 是 什么 , 对 于 规范 类 型 的 要 求 都 支配 着 
它 的 标准 行为 . 当 它 被 销毁 时 , 其 所 有 元 素 也 都 销毁 , 这 些 元 素 占用 的 资源 也 将 
全 部 释放 . 动态 序列 的 相等 和 全 序 基 于 字典 序 定义 , 就 像 array-k 一 样 . 做 一 次 
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动态 序列 赋值 , 左边 得 到 的 序列 与 右边 的 相等 但 不 相交 . 类 似 的 , 拷贝 构造 函 
数 也 创建 出 相等 的 但 不 相交 的 序列 . 

WR s 是 动态 规模 的 (或 简称 动态 的 , dynamic) 序列 , 其 规模 是 n > 0, 在 插 
入 索引 (insertion index) i 处 插入 (inserting) 一 个 规模 为 k 的 范围 7, 将 使 其 规模 
增加 到 n+k. 插入 索引 i 可 以 是 闭 区 间 [0,0] ËJ n + 1 个 值 里 的 任何 一 个 . 如 果 
s 是 插入 后 序列 的 值 , 那么 


sii) if0<j<i 
s'ü—4i(—d ifi<j<i+k 
s-k] ifitk<j<ntk 
类 似 的 , 如 果 s 是 一 个 规模 为 n > k 的 序列 , 在 其 删除 索引 (erasure index) i 


处 删除 (erasing) k 个 元 素 , 将 使 其 规模 减少 到 n 一 k. 删除 索引 i 可 以 是 闭 区 间 
[0,n 一 如 里 n 一 k 十 1 个 值 中 的 任何 一 个 . 如 果 s^ 是 删除 后 序列 的 值 , 那么 


sli] if0<j<i 
s'l] = 
р+к ifi<j<n—-k 





对 于 插入 和 删除 的 不 同 需要 , 引出 了 顺序 型 数据 结构 的 许多 变形 , 它们 有 
着 不 同 的 插入 删除 复杂 性 . 不 同类 别 主要 看 相应 的 结构 是 否 存在 远程 (remote) 
组 分 . 对 于 一 个 对 象 的 一 个 组 分 , 如 果 它 并 不 驻 留 在 从 该 对 象 的 地 址 出 发 的 某 
个 常量 偏 移 位 置 , 只 能 通过 从 对 象 头 部 开始 , 通过 遍历 该 对 象 的 坐标 结构 的 方 
式 才能 达到 , 这 一 组 分 就 称 为 是 远程 的 . 复合 对 象 的 头 部 是 指 它 的 所 有 局 部 
(local) 组 分 的 汇集 . 局 部 组 分 即 是 那些 驻 留 在 从 对 象 的 起 始 地 址 开始 具有 常 
量 偏 移 位 置 的 组 分 . 一 个 对 象 的 局 部 组 分 的 量 是 由 其 类 型 确定 的 一 个 常数 . 

本 节 将 总 结 顺序 性 数据 结构 的 一 些 性 质 . 我 们 把 这 些 数据 结构 分 为 两 个 
不 同 的 基本 类 别 : 链接 的 (linked) 和 基于 分 区 的 (extent-based). 

链接 数据 结构 通过 用 于 链接 的 指针 联系 起 有 关 的 数据 组 分 . 每 个 元 素 驻 
留 在 一 个 独立 的 具有 固定 定位 的 (permanently placed) 组 分 里 . 所 谓 具 有 固定 
定位 , 是 指 在 该 元 素 生存 期 间 其 地 址 绝 不 变化 . 除了 这 个 元 素 之 外 , 该 组 分 还 
包含 与 相 邻 组 分 的 连接 器 . 这 里 的 迭代 器 是 链接 迭代 器 , 它 不 支持 索引 迭代 器 . 
插入 和 删除 可 能 只 需 常量 时 间 , 因为 它们 都 可 以 通过 重新 链接 的 方式 完成 
ERRER RA. 链接 表 有 两 种 主要 变 体 : 单 链接 的 和 双 链 接 的 . 
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一 个 单 链接 表 (singly linked list) 只 有 一 个 链接 的 Forwardlterator. 在 特定 
的 迭代 器 之 后 插入 删除 的 代价 是 常量 的 , 而 在 任意 迭代 器 之 前 插入 或 删除 , К 
价 正比 于 从 表 头 到 这 里 的 距离 . 这 样 , 在 表 头 插入 和 删除 的 代价 总 是 常量 . 单 
链表 也 有 几 种 变 体 , 它们 之 间 的 差异 在 于 头 部 的 结构 , 以 及 是 否 存在 到 最 后 元 
素 的 链接 . 一 个 基本 单 链表 的 头 部 只 有 一 个 到 表 中 首 元 素 的 链接 , 它 也 可 能 取 
特殊 的 空 (null) 值 表明 这 是 一 个 空 表 . 没有 到 最 后 元 素 的 链接 . 循环 (circular) 
单 链表 的 头 部 只 包含 到 表 中 最 后 一 个 元 素 的 链接 , 它 也 可 能 是 空 以 表示 空 表 ; 
这 里 最 后 元 素 的 链接 指向 第 一 个 元 素 . 一 个 首尾 表 (first-last list) 的 头 部 由 两 
个 部 分 组 成 : 一 个 指向 由 空 结束 的 基本 表 的 第 一 个 元 素 , 还 有 一 个 是 到 最 后 元 
素 的 链接 . 如 果 表 空 则 后 者 也 取 空 值 . 

有 几 个 因素 影响 到 对 单 链 表 实 现 方式 的 选择 . 如 果 在 一 个 应 用 里 存在 着 大 
量 的 表 , 而 且 其 中 很 多 都 是 空 的 , 那么 尽 可 能 小 的 头 部 就 有 价值 . 循环 表 的 和 迭代 
器 可 能 比较 大 , 而 且 其 successor 操作 较 慢 , 因为 这 里 必须 区 分 指向 第 一 个 元 素 
和 指向 表 后 端 极限 的 指针 , 如果 一 个 数据 结构 只 需 常量 时 间 就 可 以 完成 尾部 
插入 , 它 就 可 以 用 于 实现 队列 或 者 输出 受 限 的 双 端 队列 . 下 表 总 结 了 不 同 的 表 
实现 上 的 各 种 权衡 情况 : 














变形 | 一 个 字 的 头 部 | 简单 的 迭代 器 | 后 端 插入 
基本 是 是 ж 
ГЕЗ 是 g | Ж 
首尾 в ® | # 








双 链 接 表 具有 链接 的 Bidirectionallterator (双向 迭代 器 ). 插入 (在 一 个 迭代 
器 前 后 ) 和 删除 的 代价 都 是 常量 . 与 单 链表 一 样 , 双 链表 也 有 几 种 变形 . 循环 双 
链表 的 头 部 包含 一 个 指针 , 指向 表 中 第 一 个 元 素 , 或 者 为 空 表示 这 是 一 个 空 表 . 
第 一 个 元 素 的 反 向 指针 指向 最 后 一 个 元 素 , 而 最 后 一 个 元 素 的 前 向 指针 指向 
第 一 个 元 素 . 带 哑 结 点 (dummy node) 的 表 与 循环 表 类 似 , 但 在 最 后 元 素 和 第 一 
个 元 素 之 间 另 有 一 个 哑 结 点 , 头 部 包含 的 是 到 该 哑 结 点 的 链接 . 在 哑 结 点 里 可 
能 没有 实际 数据 对 象 . 双 指 针头 部 (two-pointer header) 双 链 表 的 情况 与 哑 结 点 
RRM, 但 头 部 包含 两 个 指针 , 其 值 对 应 于 哑 结 点 的 两 个 链接 . 

如 前 所 述 , 有 两 个 因素 影响 到 人 们 在 不 同 的 单 链表 实现 中 的 选择 , 也 就 是 
Di Sk BR BÉ ЖЕ 88 КЕ 它们 也 都 与 在 不 同 双 链表 实现 中 的 选择 有 关 . 
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但 双 链 表 还 有 些 特殊 的 问题 . 如 果 表 有 一 个 固定 的 极限 迭代 器 , 有 些 算法 就 可 
能 简化 , 因为 这 一 极限 可 以 当 作 与 在 整个 表 上 的 任何 合法 迭代 器 都 不 同 的 值 . 
正如 将 在 本 章 后 面 看 到 的 , 如 果 存 在 从 远程 组 分 到 局 部 组 分 的 链接 , 也 会 大 大 
增加 在 该 种 类 型 的 表 里 做 元 素 重 整 的 代价 . 下 表 总 结 了 这 些 实现 权衡 : 


一 个 字 | 简单 | 无 远程 到 | 永久 的 
变 体 | 的 头 部 | ARS | 局 部 的 链接 | 极限 

















循环 | 是 | 6 是 | 6 
мад 是 | 是 是 | = 
双 指 针 | E | 是 ж | 是 


第 8 章 介 绍 过 链接 重 整 (link rearrangement), 其 中 只 是 重新 安排 了 一 个 或 
儿 个 链接 范围 里 的 链接 迭代 器 之 间 的 连接 关系 , 并 不 创建 或 销毁 迭代 器 , 也 不 
改变 迭代 器 与 它们 指向 的 对 象 之 间 的 关系 . 链接 重 整 可 以 限制 在 一 个 表 的 内 
部 , 也 可 以 涉及 多 个 表 , 从 而 导致 元 素 拥有 关系 的 变化 . 举例 说 , split-linked 用 于 
把 满足 谓词 的 元 素 从 一 个 表 移 到 另 一 个 表 , 而 combine_linked_nonempty 用 于 移 
出 一 个 表 里 的 元 素 , 并 将 它们 归并 到 另 一 个 表 . 35 3k (splicing) 也 是 一 种 链接 重 
整 , 它 从 一 个 表 中 删除 一 个 范围 , 并 将 它 重新 插入 到 另 一 个 表 里 . 

在 一 些 算法 里 没 使 用 链接 结构 里 的 反 向 链接 , 例如 做 排序 的 算法 . 但 这 种 
链接 却 很 有 用 , 它 使 在 任意 位 置 的 插入 或 删除 都 能 在 常量 时 间 完 成 , 而 在 单 链 
表 里 做 类 似 操 作 的 代价 可 能 高 得 多 . 由 于 插入 和 删除 的 代价 经 常 是 选用 链接 
表 的 首要 原因 , 因此 实际 中 确实 应 该 认真 考虑 双 链 表 . 

基于 分 区 的 (extent-based) 数据 结构 把 元 素 分 组 存 入 一 个 或 几 个 分 区 
(extent), 或 者 存 入 远程 的 数据 组 分 的 区 块 , 并 支持 对 它们 的 随机 访问 . 在 任意 
位 置 插入 删除 所 需 的 时 间 与 序列 的 规模 成 正比 , 而 在 最 后 (或 可 能 还 包括 最 前 ) 
的 插入 和 删除 只 需要 分 期 付款 式 的 常量 时 间 .4 对 于 每 种 实现 , 插入 和 删除 都 
会 按 确定 的 规则 使 一 些 特定 和 迭代 器 非法 ; 换 句 话说 , 这 里 的 任何 元 素 都 没有 持 





3. 如 果 即 使 表 为 空 时 也 分 配 一 个 哑 结 点 , 那么 就 有 了 一 个 持续 存在 的 极限 ; 不 幸 的 是 , 这 种 做 
法 违背 了 我 们 一 直 希 望 有 的 一 种 性 质 : 空 数据 结构 里 不 应 该 有 任何 远程 组 分 , 这 样 才能 保证 
不 使 用 任何 附加 资源 就 可 以 构造 相关 的 数据 结构 . 
4. 一 个 运算 的 分 期 付款 复杂 性 (amortized complexity) 就 是 最 坏 情况 下 的 一 系列 运算 的 平均 复 
杂 性 . 分 期 付款 复杂 性 的 概念 由 Tarjan [1985] 引入 . 
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久 确 定 的 位 置 . 一 些 基于 分 区 的 数据 结构 使 用 单 分 区 (single extent), 另 一 些 是 
分 段 的 (segmented), 其 中 使 用 多 个 分 区 和 一 些 附加 的 索引 结构 . 

在 单 分 区 数组 里 , 有 关 分 区 只 需要 在 规模 非 0 时 存在 . 为 避免 每 次 插入 时 
重新 分 配 , 分 区 里 应 该 保留 一 部 分 空间 ; 只 有 在 保留 空间 用 完 时 才 重 新 分 配 分 
DC. 头 部 需 包含 一 个 到 分 区 的 指针 ; 还 需要 额外 的 指针 维护 数据 和 保留 空间 的 
轨迹 , 数据 元 素 通 常 保存 在 分 区 的 前 部 . 如 果 存 在 嵌 套 的 数组 , 在 分 区 前 部 (而 
不 是 在 头 部 中 ) 放 这 些 指针 , 可 以 改善 空间 和 时 间 复 杂 性 . 

单 分 区 数组 也 有 几 种 变形 . 在 单 端 (single-ended) 数组 里 , 数据 从 分 区 中 某 
个 固定 的 偏 移 值 处 开始 存放 , 数据 之 后 是 保留 空间 .5 在 双 端 (double-ended) Ж 
组 里 , 数据 位 于 分 区 的 中 间 部 分 , 其 两 边 都 有 保留 空间 . 如 果 任何 一 端的 保留 
空间 耗 尽 , 就 重新 分 配 这 一 分 区 . 在 循环 (circular) 数组 里 , 分 区 的 处 理 方式 就 
像 是 其 最 高 地 址 的 后 面 就 是 最 低地 址 . 这 样 , 从 逻辑 上 看 , 一 块 保留 空间 就 像 是 
既 在 数据 之 前 又 在 其 之 后 , 可 以 向 两 个 方向 增长 . 

有 几 个 因素 影响 到 单 分 区 数组 的 实现 选择 . 对 单 端 和 双 端 数组 , 直接 采用 
机 器 地 址 是 迭代 器 的 最 高 效 实现 方式 ; 循环 数组 的 迭代 器 规模 大 一 些 , 而 且 其 
遍历 函数 也 慢 一 些 , 因为 这 里 需要 维持 有 关 的 轨迹 , 确定 正在 使 用 的 空间 是 否 
卷 回 到 分 区 的 开始 . 如 果 一 种 数据 结构 还 能 支持 前 端的 常量 时 间 插入 和 删除 ， 
它 就 可 以 用 作 队列 或 者 输出 受 限 的 双 端 队列 (deque). 在 任何 一 端 用 尽 了 , 即使 
另 一 端 还 有 可 用 空间 , 双 端 数组 都 需要 重新 分 配 . 而 对 单 端 的 或 循环 的 数组 ， 
可 以 到 保留 空间 耗 尽 时 再 重新 分 配 . 








A 前 端 | 重新 分 配 











变 体 | 迭代 器 | 插入 /删除 | 的 有 效 性 
单 端 | 是 | ж 是 
双 端 | 是 是 * 
循环 | 6 | 是 是 








当 一 次 插入 遇 到 了 单 端 或 循环 数组 的 分 区 满 时 , 就 会 发 生 重新 分 配 
(reallocation): 分 配 一 块 更 大 的 分 区 , 并 把 现存 元 素 移 到 新 分 区 中 . 对 于 双 端 数 
组 , 在 数组 中 耗 尽 的 一 端 插入 时 需要 重新 分 配 , 也 可 以 把 元 素 向 数组 的 另 一 端 








5. 当 然 , 完全 可 以 让 数据 从 后 面向 前 反 向 排列 , 但 是 我 们 没 看 到 这 种 做 法 的 实际 意义 . 
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移动 , 重新 安排 剩 下 的 保留 区 . 无 论 是 做 重新 分 配 , 还 是 在 双 端 数组 里 移动 元 
ж, 都 会 导致 指 到 数组 里 面 的 所 有 迭代 器 不 再 合法 . 

在 需要 重新 分 配 时 , 按 乘 以 一 个 因子 的 方式 增加 分 区 的 规模 , 可 以 得 到 按 
每 个 元 素 计算 的 分 期 付款 的 常量 代价 . 根据 我 们 的 经 验 , 以 2 作为 增长 的 因子 ， 
可 以 在 尽 可 能 减少 每 个 元 素 的 平均 分 期 付款 代价 , 与 较 好 的 存储 利用 率 之 间 
取得 很 好 的 平衡 . 


练习 12.7 请 推导 出 相应 的 表达 式 , 说 明 对 不 同 的 因子 的 存储 利用 率 和 按 每 个 
元 素 计算 的 重新 构造 次 数 . 


项 目 12.1 请 结合 理论 分 析 和 实际 试验 , 确定 在 各 种 负载 下 , 对 于 单 分 区 数组 的 
最 优 重 分 配 策略 . 


对 于 单 端的 或 循环 的 单 分 区 数组 a, 可 以 定义 一 个 函数 capacity (容量 ), 使 
size(a) < capacity(a), 只 有 在 发 现 执行 插入 操作 后 就 会 超出 a 的 容量 时 , 才 先 执 
行 重新 分 配 后 再 插入 . 还 可 以 定义 过 程 reserve (RM), 允许 把 数组 的 容量 提升 
到 某 个 指定 量 . 


练习 12.8 请 为 双 端 数组 的 容量 和 保留 操作 设计 接口 . 


一 个 分 段 的 (segmented) 数组 包含 一 块 或 几 块 保存 元 素 的 分 区 , 还 有 一 个 
索引 (index) 数据 结构 管理 指向 这 些 分 区 的 指针 . 由 于 需要 检测 是 否 到 达 分 区 
结束 , 这 里 的 迭代 器 遍历 函数 将 比 单 分 区 数组 的 情况 慢 一 些 . 索引 结构 应 表现 
出 与 分 段 数 组 一 样 的 行为 : 要 支持 随机 访问 、 后 端 插入 和 删除 . 如 果 需 要 , 还 应 
支持 相应 的 前 端 操作 . 这 里 不 需要 做 完全 的 重新 分 配 , 因为 在 一 个 现存 的 分 区 
满 时 总 可 以 再 加 入 一 个 分 区 . 只 需 在 全 部 分 区 的 一 端 或 两 端 保留 空间 . 

分 段 数组 的 主要 变化 是 索引 的 结构 . 单 分 区 (single-extent) 索引 本 身 是 一 
个 单 分 区 数组 , 分 段 (segmented) 索引 本 身 又 是 一 个 分 段 数组 , 通常 它 还 有 一 个 
单 分 区 索引 , 也 有 可 能 有 进一步 的 分 段 索 引 . Ф (slanted) 索引 可 以 有 很 多 层 ， 
其 根 是 一 个 固定 规模 的 分 区 ; 前 面 几 个 元 素 是 指向 数据 分 区 的 指针 ; 下 一 个 指 
针 指 向 一 个 间接 的 索引 分 区 , 其 中 是 指向 数据 分 区 的 指针 ; 再 后 面 的 指针 指向 
一 个 双重 间接 的 分 区 , 里 面 是 指向 间接 索引 分 区 的 指针 ; 如 此 等 等 . 






































6. 这 一 设计 基于 UNIX 的 文件 系统 [参见 Thompson and Ritchie 1974]. 
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WA 12.2 请 为 动态 序列 设计 一 套 完整 接口 . 应 包含 构造 , 插入 , 删除 , 和 拼接 
(splicing). 要 保证 存在 不 同 的 变 体 , 以 处 理 不 同 实现 方式 的 一 些 特殊 情况 . 例 
如 , 不 仅 要 能 在 指定 的 迭代 器 之 前 插入 , 还 应 能 在 迭代 器 之 后 插入 , 以 便 能 用 于 
单 链表 . 

WA 12.3 请 实现 一 个 综合 性 的 动态 序列 库 , 提供 各 种 单 链表 , 双 链表 , 单 分 
和 分 段 的 数据 结构 . 

项 目 12.4 请 基于 实际 应 用 的 负荷 情况 为 动态 序列 设计 一 个 标准 测试 集 , 以 便 
度量 各 种 数据 结构 的 性 能 . 进而 基于 上 述 工作 的 结果 为 用 户 提 供 一 个 选择 指 
ш. 





я 
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第 2 到 5 章 研究 了 各 种 数学 值 上 的 算法 , 它们 说 明了 规范 类 型 支持 的 等 值 推理 
不 仅 可 以 用 于 算法 , 也 可 以 用 于 证 明 . 第 6 到 11 章 研究 存储 区 上 的 算法 , 从 中 
可 以 看 到 , 等 值 推理 在 有 变化 的 状态 的 世界 里 依然 很 有 用 . 但 是 , 那里 处 理 的 
都 是 小 对 象 , 例如 整数 和 指针 , 其 特点 就 是 赋值 或 拷贝 的 代价 很 低 . 本 章 介 绍 
了 复合 对 象 的 概念 , 它们 也 满足 规范 类 型 的 要 求 , 因此 又 可 以 用 作 其 他 复合 对 
象 的 元 素 . 由 于 在 动态 序列 和 其 他 一 些 复合 对 象 里 区 分 了 头 部 和 远程 组 分 ， 
此 有 可 能 实现 重 整 的 高 效 方法 : 只 需 移 动 头 部 而 不 移动 远程 组 分 . 

为 了 理解 导致 复合 对 象 的 重 整 比较 低 效 的 根源 , 考虑 下 面 swap. basic 过 程 : 


template<typename T> 

requires (Regular (T)) 
void swap_basic(T& x, T& y) 
1 

T tmp = x; 

x = y; 


y = tmp; 


假设 现在 调用 swap.basic(a, b) 去 交换 两 个 动态 序列 , 易 见 , 它 执 行 的 构造 
和 两 个 赋值 都 需要 线性 时 间 . 进一步 说 , 虽然 这 里 原本 不 需要 增加 任何 存储 ， 
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但 却 可 能 导致 内 存 耗 尽 异常 . 

避免 这 种 高 代价 拷贝 的 方法 是 采用 一 种 专门 化 的 swap_basic, 它 只 交换 特 
定 动态 序列 类 型 的 对 象 的 头 部 , 如 果 需 要 就 更 新 头 部 里 到 远程 组 分 的 指针 . Ж 
而 , 这 种 专门 化 的 swap_basic 也 有 问题 . 首先 , 需要 为 每 个 数据 结构 重复 提供 这 
一 操作 . 更 重要 的 是 , 许多 重 整 算法 并 不 是 基于 swap_basic 定义 的 , 包括 各 种 原 
地 置换 算法 , 如 cycle from, 以 及 各 种 使 用 缓冲 区 的 算法 , 如 merge_n_with-buffer. 
最 后 , 还 存在 另外 一 些 情况 , 例如 在 单 分 区 数组 重新 分 配 时 , 需要 把 老 分 区 里 的 
对 象 移 到 一 个 新 分 区 . 

这 里 的 想法 是 把 交换 头 部 的 思想 推广 到 任意 的 重 整 , 希望 能 允许 使 用 缓 
冲 区 或 进行 重新 分 配 , 并 希望 继续 写 抽象 算法 , 保证 它们 不 依赖 于 被 操作 对 
象 的 实现 . 为 达到 这 一 目标 , 我 们 要 给 每 个 规范 类 型 T 关 联 它 的 基础 类 型 
(underlying type), И = UnderlyingType(T). 如 果 类 型 T 没 有 远程 组 分 , 或 者 其 远 
程 组 分 中 有 回 到 头 部 的 链接 , 那么 其 基础 类 型 U 与 T 相 同 .? 否则 , и 在 所 有 方 
面 都 和 T 一 样 , 除了 它 不 维持 T 的 拥有 关系 : 构造 时 不 影响 相关 的 远程 组 分 , 也 
就 是 说 , 拷贝 构造 和 赋值 时 都 只 拷贝 头 部 , 不 拷贝 远程 组 分 . 当 基 础 类 型 与 原 
类 型 不 同时 , 它 具 有 与 原 类 型 的 头 部 相同 的 布局 (相同 的 二 进 制 模式 ). 

具有 同样 二 进 制 模式 这 一 事实 可 以 有 下 面 解释 : 一 个 类 型 与 其 基础 类 
型 的 对 象 间 的 这 种 关系 , 使 人 可 以 通过 语言 内 部 的 reinterpret_cast 函数 模板 ， 
按 这 种 或 那 种 观点 去 看 这 片 内 存 . 在 实现 类 型 对象 的 重 整 时 , 只 能 用 
UnderlyingType(T) 对 象 保 存 临 时 值 . 对 真 的 (proper) 基础 类 型 (BI, 它 不 等 于 原 
类 型 ), 其 拷贝 构造 和 赋值 的 复杂 性 正比 于 类 型 T 的 头 部 的 规模 . 这 种 情况 还 有 
另 一 个 重要 收获 : UnderlyingType(T) 的 拷贝 构造 和 赋值 绝 不 会 抛 出 异常 . 

原 类 型 T 的 基础 类 型 的 实现 是 直截了当 的 , 而 且 可 能 自动 化 u = 
UnderlyingType(T) 总 具有 和 T 的 头 部 相同 的 布局 . 这 样 , U 的 拷贝 构造 和 赋值 也 
就 是 拷贝 这 些 二 进 制 位 , 并 不 构造 T 的 远程 组 分 的 拷贝 . 例如 , раіг, т, 的 基础 
类 型 就 是 一 个 二 元 组 , 其 成 员 就 是 T ЖП т, 的 基础 类 型 . 其 他 类 型 的 情况 也 都 
ЖШ. array-k, , 的 基础 类 型 是 数组 array k,, 其 元 素 是 T 的 基础 类 型 . 

— 8 ж Х T UnderlyingType(T), 就 可 以 用 下 面 过 程 把 对 T 引 用 强制 到 
Underlying Type(T), 这 里 不 需要 做 任何 计算 : 











7. 这 一 解释 也 是 对 从 远程 组 分 到 头 部 的 链接 的 警告 , 如 讨论 双 链 表 所 说 的 . 
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template<typename T> 


requires(Regular(T)) 
UnderlyingType(T)& underlying ref (T& x) 
{ 

return reinterpret cast«UnderlyingType(T)&» (x); 
P 


现在 可 以 把 swap-basic 重 写 为 下 面 样子 , 从 而 高 效 地 交换 两 个 复合 对 象 : 


template<typename T> 


requires(Regular(T)) 

void swap(T& x, T& y) 

t 
UnderlyingType(T) tmp = underlying ref(x); 
underlying ref (x) 7 underlying ref(y); 
underlying ref (у) = tmp; 

} 

同样 工作 也 可 以 用 下 面 方式 完成 : 


swap.basic(underlying.ref(x), underlying ref(y)); 


只 需 简单 地 按 重 新 实现 swap 的 同样 方法 重新 实现 exchange. values, 就 可 以 
把 许多 重 整 算 法 改变 为 使 用 基础 类 型 了 . 

要 处 理 其 他 重 整 算法 , 可 以 用 一 个 迭代 器 适配器 . 这 种 适配器 具有 与 
原 迭 代 器 相同 的 遍历 操作 , 但 其 值 类 型 换 成 了 原来 值 类 型 的 基础 类 型 Ж 
一 步 的 , 让 source 返回 underlying ref(source(x.i)), 让 sink 返回 underly- 
ingref(sink(x.i)). 这 里 的 x 是 适配器 对 象 , 而 i 是 在 x 里 的 原 和 迭代 器 对 
象 . 


练习 12.9 请 实现 这 样 的 适配器 , 使 之 能 用 于 所 有 和 迭代 器 概念 . 
现在 可 以 把 reverse_n_with temporary. buffer 重新 实现 为 : 














template<typename I> 
requires(Mutable(I) && ForwardIterator(I)) 


void reverse.n with temporary buffer(I f, DistanceType(I) n) 
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// ВІЗ fF: mutable counted. range(f, п) 
temporary_buffer<UnderlyingType(ValueType(I))> b(n); 
reverse_n_adaptive(underlying iterator<I>(f), n, 
begin(b), size(b)); 
2 


这 里 的 underlying iterator 是 取 自 练习 12.9 的 适配器 . 


项 目 12.5 用 基础 类 型 系统 地 彻底 改造 一 个 主要 的 C++ 库 , 例如 STL, 或 者 基 
于 本 书 的 思想 实现 一 个 新 的 库 . 


12.4 总 结 


通过 扩展 C++ 的 结构 类 型 和 常量 规模 的 数组 类 型 , 可 以 得 到 带 有 远程 部 分 的 
动态 数据 结构 . 拥有 关系 和 规范 性 的 概念 决定 了 拷贝 构造 、 赋 值 、 相 等 和 全 
序 运算 中 对 组 分 的 处 理 . 本 章 随后 以 动态 序列 作为 实例 , 说 明了 各 种 数据 结构 
的 各 种 有 用 变形 都 需要 仔细 实现 , 并 需要 写 出 文档 , 使 程序 员 能 够 为 每 个 具体 
应 用 选 出 最 合适 的 结构 . 这 里 还 阐释 了 , 通过 临时 性 地 放松 拥有 关系 不 变 式 ， 
FJ UL TRG Ж Sc BUM E ТО ЖЖ Ж. 
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> 
Ce анин. 概念 、 算 法 及 其 接口 、 编 程 
BOR, 以 及 指针 的 意义 . 还 要 讨论 每 个 主题 的 特殊 的 局 限 性 . 


规范 性 


规范 类 型 采用 与 相等 关系 一 致 的 方式 定义 拷贝 构造 和 赋值 操作 . 规范 函数 对 
相等 的 输入 返回 相等 的 输出 . 作为 例子 , 规范 变换 使 我 们 可 以 定义 分 析 轨 道 的 
算法 , 并 对 这 种 算法 做 推理 . 贯穿 本 书 的 序 关 系 、 前 向 迭代 器 的 后 继 关 系 , 以 
及 许多 其 他 东西 , 都 以 规范 性 作为 基础 . 

用 语言 内 部 的 类 型 工作 时 , 通常 都 把 判断 相等 、 拷 贝 和 赋值 操作 的 复杂 
性 看 作 是 常量 的 . 在 处 理 复合 对 象 时 , 也 期 望 这 些 操作 的 复杂 性 与 对 象 的 面积 
(area, 也 就 是 其 内 存 占 用 的 总 量 , 包括 其 局 部 组 分 和 远程 组 分 ) 成 线性 关系 , 期 
望 在 最 坏 情况 时 , 相等 判断 的 代价 也 与 其 参数 的 空间 成 线性 关系 . 但 是 , 实际 情 
况 中 这 些 期 望 却 未 必 都 能 满足 . 

举 个 例子 , 如 果 将 多 重 集 (multiset, 即 可 能 包含 重复 元 素 的 无 序 汇集 ) 表示 
为 不 排序 的 动态 序列 . 虽然 插入 新 元 素 只 需要 常量 时 间 , 但 检测 两 个 多 重 集 相 
等 却 需要 O(nlogn) 时 间 : 先 对 两 个 多 重 集 排序 , 而 后 再 按 字典 序 比 较 . 如 果 不 
经 常 做 相等 检测 , 这 样 处 理 就 很 合适 ; 但 是 , 如 果 需 要 把 一 批 这 样 的 多 重 集 放 进 
一 个 序列 , 而 后 用 find 检索 , 操作 的 性 能 将 是 无 法 接受 的 . 作为 另 一 个 极端 的 例 
F, 考虑 一 个 情况 , 其 中 某 个 类 型 的 相等 必须 通过 图 同 构 判断 来 实现 , 而 图 同 构 
问题 是 一 个 著名 的 不 存在 多 项 式 时 间 算 法 的 问题 . 

第 1.2 节 指出 , 如 果实 现 值 上 的 行为 相等 在 实际 中 不 可 行 ,我 们 经 常会 考虑 
用 表示 相等 来 代替 之 . 对 复合 对 象 , 经 常用 第 7.4 节 的 技术 来 实现 表示 相等 . 这 
种 结构 相等 (structural equality) 在 定义 拷贝 构造 和 赋值 的 语义 时 很 有 用 , 也 常 
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常 有 助 于 处 理 其 他 问题 . 请 回忆 一 下 , 表示 相等 蕴涵 着 行为 相等 . 与 此 类 似 , 在 
无 法 实现 一 种 自然 的 全 序 时 , 一 种 基于 结构 的 默认 全 序 (例如 序列 的 字典 序 ) 
使 我 们 能 有 效 实现 排序 和 检索 . 当然 , 也 存在 一 些 情况 , 其 中 的 对 象 没有 拷贝 
构造 也 没有 赋值 , 甚至 没有 相等 判断 , 因为 它们 拥有 的 资源 是 唯一 的 . 


概念 


前 面 用 了 一 些 取 自 抽象 代数 的 概念 (如 半 群 、 勾 半 群 和 模 ) 来 描述 各 种 算法 ， 
例如 乘 方 、 余 数 和 god 等 . 许多 情况 下 需要 对 标准 的 数学 概念 做 一 点 调整 , 使 
之 适合 算法 的 需要 . 有 时 还 需 引 进 新 概念 来 强化 需求 , 例如 HalvableMonoid. 有 
时 放松 了 一 些 需求 , 例如 在 考虑 partially_associative 时 . 我 们 经 常 需要 处 理 部 分 
的 定义 域 , 例如 把 定义 空间 谓词 传 给 collision_point. 数学 概念 是 可 以 使 用 和 自 
由 修改 的 工具 , 出 自 计算 机 科学 的 概念 也 一 样 . 迭代 器 的 概念 描述 了 一 些 特定 
算法 和 数据 结构 的 基本 性 质 ; 当然 , 描述 其 他 坐标 结构 的 概念 还 有 待 进一步 开 
发 . 程序 员 的 一 项 工作 就 是 确定 某 个 特定 的 概念 是 否 有 用 . 


算法 及 其 接口 


有 界 的 半 开 范围 可 以 很 自然 的 对 应 到 许多 数据 结构 的 实现 , 它 提供 了 一 种 表 
示 许 多 算法 的 输入 和 输出 的 方便 方式 , 例如 查找 、 旋 转 、 划 分 、 归 并 等 等 . A 
而 , 对 有 些 算法 , 例如 partition_point-n, 更 自然 的 接口 是 计数 范围 , 即使 对 那些 
可 以 很 自然 地 以 有 界 范 围 作为 接口 的 算法 , 通常 也 存在 它们 的 以 计数 范围 为 
接口 的 变 体 . 将 自己 限制 到 单一 的 接口 不 是 最 经 济 的 工作 方式 . 

第 10 章 描述 的 三 个 旋转 算法 对 应 于 三 种 不 同 的 迭代 器 类 型 . 对 每 一 个 算 
法 , 都 需要 去 发 现 它 的 概念 需求 . 在 它 的 输入 上 的 前 条 件 , 以 及 适合 使 用 它 的 
其 他 特性 . 单一 算法 能 适应 于 所 有 使 用 的 情景 是 很 罕见 的 . 

















编程 技术 


successor 是 一 个 纯 函数 式 的 变换 , 基于 它 可 以 写 出 许 许 多 多 清晰 而 高 效 的 算 
法 . 然而 在 第 9 3E, 我 们 却 把 对 successor 和 predecessor 的 调用 封装 到 很 小 的 变 
动 性 机 器 里 , 例如 copy.step, 因为 这 样 做 对 一 族 相关 算法 都 可 以 得 到 更 清晰 的 
代码 . 类 似 的 , 第 8 章 在 状态 机 器 里 使 用 goto, 第 12 章 为 基础 类 型 机 制 使 用 
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reinterpret cast 都 很 合适 . 我 们 不 应 该 去 限制 基础 机 器 和 语言 的 表达 能 力 ， 
而 应 该 为 每 种 可 用 结构 确定 适当 的 用 法 . 好 的 软件 产品 出 自 各 种 组 件 的 正确 
AA, 而 不 是 出 自 一 套 语法 的 或 者 语义 的 约束 . 


指针 的 意义 


本 书 阐释 了 使 用 指针 的 两 种 方式 : (1) 作为 迭代 器 或 者 其 他 坐标 , 在 算法 里 表 
示 数 据 结构 中 的 位 置 ; (2) 作为 连接 器 (connector), 表示 一 个 复合 对 象 对 其 远程 
部 分 的 拥有 关系 . 例如 , 第 12.2 节 讨 论 了 用 指针 连接 一 个 表 里 的 结 点 , 以 及 用 
指针 连接 一 个 数组 的 一 批 分 区 . 

指针 的 这 两 种 用 途 也 确定 了 在 一 个 对 象 被 拷贝 、 销 毁 或 比较 相等 时 的 不 
同行 为 . 拷贝 一 个 对 象 时 需要 沿 着 其 连接 器 拷贝 远程 组 分 , 所 以 新 对 象 将 包含 
新 的 连接 器 , 它们 指向 那些 被 拷贝 的 新 组 分 . 另 一 方面 , 拷贝 包含 迭代 器 的 对 
象 时 (例如 对 一 个 bounded.range), 则 只 应 简单 地 拷贝 迭代 器 而 不 要 追溯 它们 
去 继续 拷贝 . 与 此 类 似 , 销毁 一 个 对 象 时 需要 沿 着 它 的 连接 器 销毁 其 远程 组 
分 , 而 销毁 一 个 包含 迭代 器 的 对 象 则 不 影响 被 迭代 器 指向 的 那些 对 象 . 最 后 , 比 
较 容器 的 相等 需要 沿 着 连接 器 去 比较 对 应 的 组 分 , 而 非 容器 的 相等 (例如 对 于 
bounded. range) 则 只 应 检测 迭代 器 相等 . 

当然 , 还 存在 指针 的 第 三 种 使 用 : 表示 事物 之 间 的 关系 (relationship). 两 个 
或 更 多 对 象 之 间 的 关系 并 不 是 这 些 对 象 所 拥有 的 组 分 ; 一 个 关系 有 它 自 己 的 
存在 , 同时 又 维持 它 所 联系 的 对 和 象 之 间 的 相互 依赖 . 一 般 而 言 , 表示 关系 的 指 
针 并 不 参与 各 种 常规 运算 . 例如 , 拷贝 一 个 对 象 时 不 需要 检查 或 拷贝 关系 指针 ， 
因为 相应 关系 只 对 这 一 对 象 有 效 , 与 其 拷贝 无 关 . 如 果 一 个 一 对 一 关系 用 一 对 
链接 两 个 对 象 的 嵌入 式 的 指针 表示 , 无 论 销 毁 哪个 对 象 , 都 需要 清除 位 于 另 一 
对 象 里 的 相应 指针 . 

在 将 数据 结构 设计 为 带 有 拥有 关系 和 远程 组 分 的 复合 对 象 时 , 应 该 采用 这 
样 一 种 编程 风格 , 其 中 让 各 种 基本 对 象 ( 即 那些 不 作为 其 他 对 象 的 子 部 分 的 对 
象 ) 都 驻 留 在 静态 变量 里 , 其 生存 期 是 程序 的 整个 执行 期 间 (对 于 局 部 变量 , 其 
生存 期 是 一 个 分 程序 的 执行 期 间 ), 而 让 动态 分 配 的 部 分 仅 作 为 远程 组 分 . 这 样 
就 把 Algol 60 的 基于 栈 的 块 结构 拓展 到 处 理 任 意 的 数据 结构 . 这 种 结构 能 自然 
地 符合 许多 应 用 的 需要 . 当然 , 也 存在 一 些 情形 , 其 中 需要 采用 引用 计数 、 废 料 
收集 或 其 他 存储 管理 技术 . 
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程序 设计 是 一 种 迭代 式 过 程 : 研究 有 用 的 问题 , 发 现 处 理 它们 的 高 效 算法 , 精 
炼 出 算法 背后 的 概念 , 再 将 这 些 概念 和 算法 组 织 为 完满 协调 的 数学 理论 . 每 一 
个 新 发 现 都 带 来 知识 的 增长 , 但 每 个 知识 片段 又 有 其 自身 的 局 限 性 . 
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` 
Boum 全 表示“ 按 定义 相等 ". 

如 果 P 和 Q 是 命题 , 那么 ~P ( 读 作 "JE P"). PV Q (“P BR Q”). PAQ (“Р 
5 Q"). P > Q (“P # Q) ДЖ P e Q (“P 等 价 于 Q”), 也 都 是 命题 , 对 于 等 
Mfr, 也 经 常 说 “P 当 且 仅 当 Q”. 

如 果 P 是 命题 而 x 是 变量 , 那么 (3x)P 也 是 一 个 命题 ( 读 作 “存在 x 使 得 
P”). 如 果 P 是 命题 而 x 是 变量 , 那么 (vx)P 也 是 一 个 命题 ( 读 作 “对 所 有 的 x, 
Р”); (Vx)P «> (—(Эх)-Р). 

本 书 使 用 了 下 面 来 自 集合 论 的 术语 和 记 法 : 

a € X (“a 是 X 的 元 素 ”) 

X c Y (“X BY MFR") 

{ао,...,а„} (“由 元 素 ao, ..., a, HARA A S Ж”) 

{a € XIP(a)) (“X 中 满足 谓词 P 的 所 有 元 素 构 成 的 子 集 ”) 

XUY (“X M Y RHK”) 

xn Y (“x 和 YY 的 交集 ”) 

X x Y (“X #l Y ËJ did) 

f: X — Y (“f FEM x 到 Y 的 函数 ") 

f: Xo x Xi > Y (“f 是 从 Xo 和 Xi 的 乘积 到 Y 的 函数 ”) 

xm E(x) (“x 映射 到 E(x)”, 总 写 在 给 了 函数 签名 之 后 ) 

BJ E js] (closed interval) [a,b] 是 所 有 满足 a < x < b 的 元 素 x HRA. + 
区 fi] (open interval) (a,b) 是 所 有 满足 a < x < b 的 元 素 x 的 集合 . 右 半 开 区 间 
(half-open-on-right interval) [a,b) 是 所 有 满足 a < x < b 的 元 素 x 的 集合 . 左 半 
开 区 间 (half-open-on-left interval) (a,b) 是 所 有 满足 a < x < b 的 元 素 x 的 集合 . 


Download at hti: / /w ww pinSi.com, 


242 附录 A 数学 表示 


半 开 区 间 (half-open interval) 是 右 半 开 区 间 的 简称 . 这 些 定义 都 推广 到 弱 序 . 
规程 (specification) 中 使 用 了 下 面 记 法 , 其 中 的 i 和 j 是 迭代 器 , n 是 整数 : 
i<j (S AT j”) 
ixj (ч HF RSF j”) 

[,3) (“А i3 j 的 半 开 有 界 范围 ”) 

fii) (“A J; 的 闭 有 界 范围 ?) 

[i n) (“从 i 开始 n>0 的 半 开 的 弱 或 计数 范围 ") 

[in] (“A i п> 0 的 闭 的 弱 或 计数 范围 *) 

讨论 概念 时 采用 了 下 面 术语 : 

48 (weak) 表示 要 求 减弱 公理 , 包括 放松 一 些 要 求 . 如 弱 序 用 等 价 代替 相等 . 
+ (semi) 指 减少 一 个 运算 . 例如 , 半 群 没有 求 逆 . 

部 分 (partial) 指 对 定义 空间 的 限制 . 例如 , 部 分 减法 (partial subtraction, 或 

称 删除 , cancellation) a 一 b RÆ a >b 时 有 定义 . 
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Sean Parent 和 Bjarne Stroustrup 


p -— C++ +£. 为 简化 语法 形式 , 这 里 把 一 些 库 功 能 
当 作 内 部 功能 使 用 . 这 些 功能 没有 用 这 一 子 集 书写 , 其 中 用 到 一 些 另外 的 C++ 
特征 . B.1 节 定 义 这 一 C++ 子 集 ; B.2 节 描述 上 述 内 部 功能 的 实现 . 


BA 语言 定义 
语法 记 法 约定 


这 里 采用 的 是 Niklaus Wirth 设计 的 一 种 Backus-Naur 范式 (Backus-Naur Form) 
的 扩充 形式 . Wirth [1977, 822-823 页 ] 对 这 种 形式 的 说 明 如 下 : 


术语 标识 符 (identifier) 用 于 指 非 终结 符号 (nonterminal symbol), 
而 文字 (literal) 指 终 结 符 号 (terminal symbol). 为 简洁 起 见 , identi- 
fier 和 character 的 进一步 细节 都 没有 定义 . 


syntax = {production}. 
production = identifier "=" expression ".". 
expression = term {"|" term}. 
term = factor {factor}. 
factor = identifier | literal 
| "(" expression ")" 
| "[" expression "]" 


| "(" expression "}". 
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literal = """" character {character} """". 


重复 用 花 括 号 表示 , 也 就 是 说 , {a} 表示 e | а | аа | ааа | .... 
可 选项 用 方 括号 , 这 样 [a] 表示 a | е. 圆 括号 只 用 于 分 组 , 例如 
(a | b) c 表 示 ac | bc. 终结 符号 ( 即 文字 ) 用 双 引 号 括 起 (鉴于 
Jt, 如 果 引 号 本 身 作为 文字 出 现 , 就 将 它 写 两 次 ). 


词法 约定 
下 面 产生 式 给 出 了 标识 符 和 文字 的 语法 : 


identifer = (letter | " ") {letter | " " | digit}. 
literal = boolean | integer | real. 

boolean  - "false" | "true". 

integer = digit {digit}. 


real = integer "." [integer] | "." integer. 
注释 从 两 个 斜 线 开 始 直至 一 行 结束 : 


comment 7 "//" {character} eol. 


基本 类 型 


这 里 用 到 C++ 的 三 个 类 型 : bool 只 包含 值 false 和 true, int 包含 带 符号 的 
整数 值 , 还 有 double 是 IEEE 64 位 标准 的 浮 点 值 : 


basic type = "bool" | "int" | "double". 

表达 式 

表达 式 可 以 有 运行 时 的 表达 式 或 编译 时 的 表达 式 . 编译 时 表达 式 可 能 在 编译 
中 求 值 出 一 个 值 或 一 个 类 型 . 


表达 式 由 下 面 语法 定义 . 内 层 产 生 式 里 的 运算 符 (在 语法 里 写 的 靠 下 ) 的 
优先 级 高 于 外 层 产生 式 里 的 运算 符 : 
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expression 7 conjunction ("||" conjunction}. 

conjunction = equality ("&£" equality). 

equality 7 relational (("--" | "!-") relational). 

relational = additive (("«" | ">" | "<=" | ">=") additive}. 
additive = multiplicative {("+" | "-") multiplicative}. 
multiplicative = prefix {("*" | "/" | "4") prefix). 

prefix = ["-" | "!" | "const"] postfix. 

postfix = primary ("." identifier 


| "(" [expression list] ")" 
| "[" expression "]" 
| "а". 
primary 7 literal | identifier | "(" expression ")" 


| basic type | template name | "typename". 


expression list - expression ("," expression). 


11 和 && 运算 符 分 别 表示 У ( 析 取 ) AA (AM). 它们 的 运算 对 象 必须 具有 
布尔 值 . 其 第 一 个 运算 对 象 先 于 第 二 个 求 值 . 如 果 根 据 第 一 个 运算 对 象 的 值 足 
以 确定 表达 式 的 结果 (对 于 11 是 true, 或 对 于 & 是 false), 第 二 个 运算 对 象 
就 不 再 求 值 , 结果 就 是 第 一 个 运算 对 象 的 值 . 前 级 运算 符 ! 是 ~ (否定 ), 只 能 用 
于 布尔 值 . 

== 和 != 分 别 表示 相等 和 不 等 运算 符 , 它们 返回 布尔 值 . 

<. >. <= 和 >= 分别 表示 小 于 、 大 于 、 小 于 等 于 和 大 于 等 于 , 它们 都 返回 
布尔 值 . 

+ 和- 分别 是 加 和 减 , 一 元 前 缀 - ERR. 

* ALIWER. важе. 

后 缀 . (AA) 的 左边 应 该 是 一 个 结构 类 型 的 对 象 , 它 返 回 跟 随 圆 点 之 后 的 
标识 符 表示 的 成 员 . BRO 的 左边 应 是 一 个 过 程 或 者 一 个 应 用 运算 符 有 定义 
的 对 象 , 返回 对 于 给 定 的 实 参 应 用 这 个 过 程 或 者 函数 对 象 的 结果 . 如 果 是 应 用 
到 一 个 类 型 , O 用 给 定 参数 做 相应 的 对 象 构 造 , 如 果 应 用 到 一 个 类 型 函数 , 它 
返回 另 一 个 类 型 . SRO 的 左边 应 是 一 个 索引 运算 符 有 定义 的 对 象 , 它 返 回 
由 方 括号 里 的 表达 式 的 值 确定 位 置 的 那个 元 素 . 
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WA const 是 一 个 类 型 运算 符 , 返回 其 参数 类 型 的 常量 类 型 . 在 用 于 引用 
类 型 时 , 得 到 的 是 其 基础 引用 类 型 的 一 个 常量 版 本 的 类 型. 
后 级 是 一 个 类 型 运算 符 , 返回 其 参数 类 型 的 引用 类 型 . 


枚 举 


一 个 枚 举 生成 一 个 类 型 , 对 应 于 表 中 的 每 个 标识 符 有 唯一 的 一 个 值 . 枚 举 上 
有 定义 的 仅 有 运算 就 是 规范 类 型 上 都 有 的 几 个 : 相等 、 关 系 运 算 、 不 等 、 构 
造 、 析 构 和 赋值 : 


enumeration = "enum" identifier "{" identifer list ")" ";". 


identifer list - identifier ("," identifier). 


结构 


一 个 结构 是 一 个 类 型 , 它 由 一 组 有 类 型 的 对 象 ( 称 为 其 数据 成 员 ) 组 成 , 这 些 
对 象 采 用 互 不 相同 的 命名 . 某 个 数据 成 员 或 是 一 个 独立 的 对 象 , 或 是 常量 大 
小 的 数组 . 此 外 , 一 个 结构 还 可 能 包含 一 些 构造 函数 、 一 个 析 构 函数 和 一 
些 成 员 运 算 符 (赋值 、 应 用 运算 符 和 索引 ) 的 定义 , 还 可 以 包含 一 些 局 部 的 
typedef. 带 有 应 用 运算 符 成 员 的 结构 称 为 函数 对 象 (function object). 去 掉 结 
构 体 (structure.body) 就 是 结构 的 事先 声明 . 


structure = "struct" structure_name [structure_body] ";". 
structure_name = identifier. 

structure_body = "{" {member} "}". 

member = data_member 


| constructor | destructor 
| assign | apply | index 
| typedef. 


data_member = expression identifier ["[" expression "]"] ";". 


constructor structure name "(" [parameter list] ")" 


[":" initializer list] body. 


destructor 7 "^" structure name "(" ")" body. 
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assign "void" "operator" "=" 


"(" parameter ")" body. 


apply = expression "operator" "(" ")" 
"(" [parameter list] ")" body. 
index 7 expression "operator" "[" "]" 


"(" parameter ")" body. 


initializer list - initializer ("," initializer). 


initializer 7 identifer "(" [expression list] ")". 


以 一 个 到 本 类 结构 的 常量 应 用 为 参数 的 构造 函数 称 为 拷贝 构造 函数 (copy 
constructor). 如 果 没 有 定义 拷贝 构造 函数 , 编译 器 自动 生成 一 个 按 成 员 逐 个 做 
的 拷贝 构造 函数 . 没有 参数 的 构造 函数 称 为 默认 构造 函数 (default constructor). 
如 果 没 定义 任何 构造 函数 , 编译 器 自动 生成 一 个 默认 构造 函数 , 它 一 个 个 地 构 
造 各 个 成 员 . 如 果 没 有 定义 赋值 运算 符 , 也 将 自动 生成 一 个 按 成 员 拷贝 的 赋值 
运算 符 . 初始 化 表 (initializer list) 里 的 每 个 标识 符 应 是 该 结构 的 一 个 数据 成 员 
的 标识 符 . 如 果 一 个 构造 函数 包含 初始 化 表 , 表 中 的 数据 成 员 将 用 与 相应 初始 
式 (initializer) 匹配 的 构造 函数 进行 构造 !; 所 有 这 些 构造 都 发 生 在 构造 函数 的 
体 执行 之 前 . 


过 程 


一 个 过 程 包含 一 个 返回 类 型 (没有 返回 值 时 用 void), 随后 是 它 的 名 字 和 形 参 
ж. 名 字 可 以 是 标识 符 或 者 运算 符 . 形 参 表 里 的 expression 必须 能 说 明 一 个 类 
型 , 可 以 用 不 包括 体 的 过 程 签名 作为 事先 声明 . 


procedure = (expression | "void") procedure name 
"(" [parameter list] ")" (body | ";"). 

procedure name - identifier | operator. 

operator = "operator" 


("==" | "<" ponen | "=" | "ew | onn | nyn), 





1. 执 行 重 载 解析 时 所 用 的 匹配 机 制 只 做 准确 匹配 , 不 做 任何 隐 式 转换 . 
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parameter_list = parameter {"," parameter}. 

parameter = expression [identifier]. 

body = compound. 


只 有 这 里 列 出 的 运算 符 可 以 定义 . 对 运算 符 != 的 定义 基于 == 生成 ; 对 运 
算 符 >、<= 和 >= 的 定义 基于 < 生成 . 在 调用 一 个 过 程 时 , 各 个 实 参 表达 式 的 值 
绑 定 到 对 应 的 形 参 , 而 后 执行 过 程 体 . 
语句 
过 程 、 构 造 函 数 、 析 构 函 数 和 成 员 运算 符 的 体 是 语句 : 


{identifier ":"] 


(simple_statement | assignment 


statement 


| construction | control_statement 
| typedef). 





simple_statement = expression ";". 





assignment = expression "=" expression ";". 
construction = expression identifier [initialization] ";". 
initialization = "(" expression list ")" | "=" expression. 


control statement = return | conditional | switch | while | do 
| compound | break | goto. 

return 7 "return" [expression] ";". 

conditional = "if" "(" expression ")" statement 


["else" statement]. 





switch 7 "switch" "(" expression ")" "(" (case) ")". 
case = "case" expression ":" {statement}. 
while 7 "while" "(" expression ")" statement. 
do 7 "do" statement 
"while" "(" expression ")" ";". 
compound = "(" {statement} ")". 
break = "break" ";". 


goto = "goto" identifier ";". 
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typedef = "typedef" expression identifier ";". 


对 简单 语句 (常见 的 如 过 程 调 用 ) 求 值 是 为 了 它 的 副作用 . 赋值 (assign- 
ment) 也 就 是 应 用 其 左边 的 那个 对 象 的 类 型 的 赋值 运算 符 . 构造 (construction) 
的 expression 是 一 个 类 型 表达 式 , 给 出 被 构造 的 类 型 . 没有 初始 化 部 分 (ini- 
tialization) 而 构造 时 将 应 用 默认 构造 函数 . 带 有 括 起 的 表达 式 的 构造 应 用 
与 之 匹配 的 构造 函数 . 如 果 是 用 一 个 等 号 构造 , 跟随 其 后 的 就 是 送 给 拷贝 构造 
函数 的 表达 式 , 该 表达 式 必须 具有 与 所 构造 对 象 同样 的 类 型 . 

return 语句 将 控制 返回 当前 函数 的 调用 方 , 还 返回 表达 式 的 值 作为 函数 
结果 . 该 表达 式 必 须 能 求 出 函数 的 返回 值 类 型 的 值 . 

如 果 条 件 语句 (conditional) 的 expression 的 值 是 真 , 它 就 执行 其 第 一 个 语 
fj, 如 果 是 假 而 且 有 else 子 句 , 就 执行 第 二 个 语句 . 这 里 的 expression 必须 求 
出 布尔 值 . 

switch 语句 先 求 值 expression, 而 后 执行 与 得 到 的 值 匹 配 的 第 一 个 case 
标号 之 后 的 语句 ; 然后 执行 随后 的 语句 , 直至 switch 语句 结束 , 或 者 直至 执行 
到 一 个 break 语句 . switch 语句 的 expression 必须 求 出 一 个 整数 或 者 枚 举 值 . 

while 语句 反复 求 值 其 expression, 只 要 它 为 真 就 执行 statement. do 语句 
反复 执行 其 statement 而 后 求 值 其 expression, 直至 该 expression 的 值 为 假 . 
对 于 这 两 种 情况 , expression 都 必须 求 出 布尔 值 . 

复合 语句 (compound) 按 顺 序 执 行 其 语句 序列 . 

goto 语句 使 执行 转 到 当前 过 程 中 对 应 标号 处 的 语句 . 

break 语句 终止 外 围 最 小 的 switch. while 或 者 do 语句 , 使 执行 转 到 被 终 
止 的 语句 之 后 的 语句 并 从 那里 继续 . 

typedef 语句 为 一 个 类 型 定义 别名 . 


模板 


模板 使 我 们 可 以 用 一 个 或 多 个 类 型 或 常量 将 结构 或 过 程 参数 化 . 模板 定义 和 
模板 名 用 < 和 > 作为 分 隔 符 .2 


template = template_decl 





2. 为 消除 < 和 > 作为 关系 运算 符 或 模板 名 分 隔 符 的 歧义 性 , 一 旦 一 个 structure папе 或 者 
procedure папе 在 语法 分 析 时 被 作为 一 个 template 的 一 部 分 , 它 就 变 成 了 一 个 终结 符号 . 
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(structure | procedure | specialization). 
specialization = "struct" structure name "<" additive list ">" 
[structure body] ";". 
template decl = "template" "«" [parameter list] ">" [constraint]. 


constraint 7 "requires" "(" expression ")". 


template name = (structure name | procedure. name) 
["«" additive list "»"]. 
additive list = additive ("," additive). 


34—^ template name 被 用 作 原 语 时 , 相应 的 模板 定义 将 用 于 生成 实际 的 
结构 或 过 程 , 其 中 的 模板 参数 都 用 对 应 的 模板 实 参 取代 . 这 些 模 板 实 参 或 者 是 
显 式 提供 , 放 在 template name 之 后 作为 其 实 参 , 或 者 (对 于 过 程 而 言 ) 是 根据 
过 程 的 参数 类 型 推导 出 来 . 

模板 结构 可 以 专门 化 , 以 提供 了 该 模板 的 另 一 定义 , 当 其 参数 的 匹配 优 于 
对 应 的 未 专门 化 的 模板 版 本 时 , 就 会 考虑 它 的 使 用 . 

当 模 板 定义 包含 一 个 约束 (constraint) 部 分 , 模板 的 参数 类 型 和 值 都 必须 
满足 requires 后 面 的 布尔 表达 式 . 


内 部 定义 


pointer(T) 是 一 个 类 型 构造 符 , 返回 指向 了 的 指针 类 型 如果 x 是 类 型 T 
的 对 象 , addressof(x) 返回 一 个 pointer(T) 类 型 的 值 , 也 就 是 对 x 的 引用 . 
source, sink 和 деге? 都 是 定义 在 指针 类 型 上 的 一 元 函数 .source 对 所 有 
指针 类 型 有 定义 , 返回 对 应 的 常量 引用 , 参看 第 6.1 1. sink 和 deref {ЯЯ} 
指向 非常 量 对 象 的 指针 类 型 有 定义 , 返回 对 应 的 非常 量 引用 , 参看 第 9.1 节 . 
reinterpret cast 是 一 个 函数 模板 , 它 以 一 个 引用 类 型 和 一 个 对 象 (以 引用 方 
式 传递 ) 为 参数 , 返回 指向 该 对 象 的 具有 特定 的 引用 类 型 的 引用 . 该 对 象 必须 
存在 基于 这 一 引用 类 型 的 解释 . 
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В.2 宏和 特征 结构 

为 使 B.1 节 定 义 的 语言 能 作为 合法 的 C++ 程序 进行 编译 , 需要 有 几 个 宏和 结 
Hp X. 

模板 约束 

requires 子 句 用 下 面 的 宏 实 现 :3 


#define requires(...) 


内 部 定义 


引入 pointer(T) 和 addressof (x) 是 为 了 给 出 一 种 线性 的 描述 方式 , 而 且 支持 
简单 的 自 上 而 下 语法 分 析 . 它们 的 实现 如 下 


#define pointer(T) T+ 


template<typename T> 
pointer(T) addressof(T& x) 


t 

return &x; 
} 
类 型 函数 


类 型 函数 通过 一 种 称 为 特征 类 (trait class) 的 C++ 技术 实现 . 对 每 个 类 型 函 
Ж, 例如 ValueType, 我 们 都 定义 一 个 结构 模板 , 这 里 是 value_type<T>. 该 结构 
模板 只 包含 一 个 typedef, 为 方便 起 见 这 里 用 名 字 type; 如 果 适 宜 , 可 以 在 基 结 
构 模板 里 提供 一 个 默认 的 定义 : 

template<typename T> 


struct value_type 


{ 





3. 这 一 实现 意味 着 只 把 需求 看 作文 档 . 
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typedef T type; 
н 

为 了 提供 一 种 方便 的 使 用 方式 , 我 们 定义 一 个 宏 4, 它 提取 出 相应 的 typedef 
作为 类 型 函数 作用 的 结果 : 


#define ValueType(T) typename value type< T >::type 
这 里 为 特点 类 型 做 一 个 专门 化 , 作为 全 局 定义 的 精 化 : 


template<typename T> 
struct value_type<pointer(T)> 
1 
typedef T type; 
}; 





和 4 这样 的 宏 只 在 模板 定义 里 可 用 , 因为 其 中 用 了 关键 词 typenane. 
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